您的位置 首页 设计

交换机在网络中的故障诊断

交换机在网络中的故障诊断

在一个交流网络里,您怎么承认从哪里开端着手查找问题?想深化“透视”一个交流网络是十分困难的。首要,在2层交流的时分仍是桥接转发办法,但到了3层交流却有了更高档的特性和转发规矩,例如VLAN|0″>VLAN

  到了4层交流,就愈加杂乱了,呈现了更高档的转发和负载均衡技能,毛病诊断毛病诊断和处理就需求更多的交流机装备常识。

  在装置完一台交流机后,每个交流机的半双工端口就构成了一个抵触域。假如该端口衔接了一个集线器,集线器下面衔接若干站点,那么抵触域会扩展。但随着交流产品的价格跌落,现在大多数新建的网络每个交流端口都只衔接一个站点。因而,在半双工衔接情况下,抵触域仅针对一个独自的电缆链路。

  交流机一般是一个独立播送域的一部分,包含串连或许并连的恣意数意图其他交流机。假如运用了OSI|0″>OSI模型3层的功用,就可以创立多播送域,播送域的数目与VLAN数目持平。最极限的情况,假如交流机功用答应,每个端口可以装备为一个独立的播送域。可以把这种情况描绘为路由到桌面。为每个端口创立一个独立的播送域后,毛病诊断就会严厉受限。可是假如咱们把每个端口设置为一个独自的播送域,交流机在转发流量的时分,每个端口都需求路由服务,这会占用交流机CPU的有限资源。在网络环境中,对每个独自的端口进行路由恳求和应对是十分困难的,咱们应该防止这样的装备。不幸的是,这种情况在实践情况中十分常见,网络中常常发现服务器悉数在一个子网或许播送域中,一切的客户在别的的子网或许播送域中。在这种情况下,一切的恳求都有必要路由。假如保护行为约束在一个独自的服务器群里,那么考虑把服务器放进独自的VLAN里。然后把运用这台服务器的用户放到同一个VLAN。这样就可以运用2层交流的桥接办法来交流流量,只要很少的恳求需求路由。假如服务器支撑多于一个用户区,可以在服务器上多装一块网卡来完成到用户的2层交流衔接。

对交流机进行毛病诊断的5种技能

  可以采纳5种根本办法来透视交流机。每一种办法都不同,都有活跃或许消沉的一面。相似在网络中遇到的其他问题相同,没有一个最好的答案。最适宜的计划往往取决于您手中可以运用到的资源(什么东西可以运用或许曾经装置过什么东西),而且运用这些技能有或许形成服务中止。

  即便把这些办法组合起来,也不能监测到所衔接的网络,在交流的环境里边,也不像集线器那样便利监测。咱们简直不或许看到经过一个交流机的悉数流量。大多数的毛病诊断会假定流量会在站点和所衔接的服务器之间或经过毛病诊断交流机uplink口经过。而实践上假如2台主机直接传输信息的话,就不会运用交流机的uplink口或许任何其他的端口来交流流量。除非你知道详细用到哪个端口,否则是监测不到的。

  举个比如,如图1,一台服务器接入一台交流机。在反映有问题的用户中,一部分是直接与这台交流机相连,别的的一部分用户是由这台交流机的uplink口从其他路由器或许交流机衔接上来的。毛病陈述是拜访服务器“慢”,这样的毛病陈述对技能支撑工程师来说根本上没有任何价值。

图一、一个最根本的交流机环境

办法1:经过TELNET或许串行口接入服务器

  高档的网络技能支撑工程师或其他知道交流机暗码的人在进行毛病诊断时可以挑选经过TELENET或许交流机的串口登陆,来查看交流机的装备。(如图2)

图 2、运用RS-232 操控端口

  交流机装备可以经过上面说到的2种办法查看,尽管问题纷歧定是装备引起的。不论问题是操作体系有BUG仍是装备不完善,都不能从装备列表中简略的查看出。装备信息在定位交流机是否像预期的那样运转上比较有用,但针对毛病诊断就不是了。为了验证交流机的装备,往往需求运用多种的交流机毛病诊断办法合作。

  许多交流机都带有实时的毛病诊断东西,由于交流机生产厂家和类型的不同,这些毛病处理东西的特征也各不相同。可是要运用好这些东西,有必要依托必定的理论常识和实践经历。

办法2:衔接到一个闲暇端口

  最简略的毛病诊断办法是在交流机的闲暇端口接入一个监测东西,例如协议剖析仪。

图3、从恣意端口监测

  把监测东西接入交流机的一个闲暇端口,不必中止服务就可以查看所属播送域。该监测东西与播送域里的其他站点相同有相同的权限。

  不幸的是,交流机(做为一个多端口的桥接设备)简直不转发流量到监测端口。由于桥接设备便是这样规划的,流量直转发到所属的意图端口,不会去其他的端口。协议剖析仪因而简直监测不到流量。

图4、交流机在源端口和意图端口之间转发流量。十分少的流量会转到其他端口。站点和服务器之间或许每秒钟会转发几千个帧,可是监测端口每分钟只能看到几个帧。

  转发到监测端口的流量简直悉数都是播送,包含一些零散的意图地址不明的帧。这些零散的帧是由于路由转宣布老化的成果,常常是意图端口不明的帧。一些经历不行的技能人员看到这么高的播送(挨近100%),却没有留意到端口运用率很低,就误判网络呈现了播送风暴,其实不是。

  这样查看交流网络简直没有用,由于监测东西有必要获取流量。取得的流量或许对播送域的查询对网络查找和发现其他类型问题是有很有协助的,但对处理用户衔接慢的问题并没有多大的协助。

  对大多数交流机来说,都有一个更好的挑选,可以把需求监测的端口流量备份到一个专门的闲暇口。这种技能一般称为端口镜像。

  大多数交流机厂家都供给备份或镜像流量的功用,可以把监测东西接入交流机一个专门装备过的端口。老的交流机有必要指定一个专门的监测口做为镜像口,但现在大多数新的交流机可以指定任何一个端口做为镜像口。

  尽管交流机厂家完成镜像的办法各不相同,可是有一些根本相同的监测选项。值得留意的是,简直在一切的情况下,交流机在转发流量到镜像口的时分,一起把过错都过滤掉了。关于毛病诊断来说,这意味着一起过滤掉了有用的信息。

  此外,实践操作傍边需求咱们经过操控口(交流机的RS232端口),或许Telnet进程来装备镜像。这意味着除了监测东西之外,咱们一般还需求带一台电脑或许终端来对交流机进行装备。

  镜像端口常常仅仅一个“监听”端口,不过许多交流机厂家答应把该端口装备满足双工的。装备了镜像口,监测东西就可以查看陈述衔接慢的主机和服务器之间的实践流量的备份。镜像口可以只监测交流机的恣意一个端口,乃至可以是Uplink口,也可以一起监测交流机的多个端口。可是一起监测的端口许多的话,过高的流量就有或许会超越镜像口的接纳才能。

  监测端口的输出才能是一个很重要的问题。镜像口可以收,也可以发。在装备的时分,常常关掉了镜像口发的功用。但不论有没有关掉镜像口发的功用(不论镜像口是全双工或许不是),镜像口的接纳才能都是有约束的。假如被监测的全双工端口的速率和镜像口是相同的话,交流机在转发流量的时分很简略就会丢包,可是交流机不会告诉您。

  假定您在监测一个以100M全双工速率衔接到交流机的服务器的话,那么服务器在全双作业业的时分,服务器的收发速率都是100M,那么一共就有了200M。可是交流机的100M镜像口最多只能接纳100M的流量。所以任何交流机的端口(全双工的)运用率超越50%的时分,镜像口接纳到的包就会有丢掉。

  假如把多个端口镜像到一个端口,丢包的问题就会愈加的严峻。由于大多数交流机都作业在低容量,这个问题并不会被马上留意到。大多数用户衔接的均匀运用率都很低。仅仅偶然会有流量的突发。

  假如挑选一个高速的镜像口,就可以削减丢包的问题。例如把图6中的100M镜像口换成1000M,那么就可以很简略的接纳200M的监测流量。

办法3:在链路上接入集线器

  运用集线器很具有战略意义。对许多网络来说,大多数发送和接纳的流量都来源于文件服务器之类的同享设备。在交流机端口和文件服务器中心接入一个集线器,再把剖析仪接入集线器,实践上就把剖析仪和文件服务器接入了同一个播送域。如图7所示。运用这种办法,技能支撑人员就可以看到文件服务器一切进出的流量,协助技能支撑人员处理一系列的问题,包含用户登陆失利、功用低效、衔接丢掉等。

图5、运用集线器监测交流机端口

  接入集线器的办法许多时分都不有用,特别是在需求监测多个服务器的时分。在哪里接入集线器适宜?一切的服务器都要衔接吗?假如是用一个集线器,换来换去衔接的话,您必定不希望您的网络这样频频地被搅扰。衔接集线器所带来的时延,常常会带来衔接的丢掉。别的,许多时分监测东西并不支撑服务器所选用的技能或许衔接速率。

  运用同享集线器监测一条链路上的一切流量和过错仍然是一个有用的办法。这简直是仅有一种可以在交流网络环境中实践查看和剖析MAC层过错的办法。运用SNMP来发现这些过错也可以。可是,为了更好地进行过错剖析,仍是用监测东西直接查看最直接。

  接入集线器的办法有2种首要缺陷。服务器链路有或许不是全双工的,或许和集线器的端口双工情况不匹配,这会给监测带来更多的不愿意看到的过错成果。而且运用这种办法时,手头有必要要有一个同享集线器。现在许多新式的集线器都相似于交流机,而不是同享的转发设备。接入这种新式的集线器,相当于接入了一个新的交流机,您会看不到想要查看的流量,对监测起不到什么效果。安恒公司假如接入的是双速率的集线器,例如10M/100M双速率的,或许每个速率都供给了一个播送域,两个速率之间再进行转发。在这种情况下,需求承认被监测链路和监测东西运转在相同速率,才可以运用这种双速率集线器。还有一些集线器供给在一切端口之间转发的功用,更因而把自己标榜为价格廉价的交流机,给人形成误解。他们都不能用在这种监测办法上。

办法4:运用一个TAP(监测接口盒)或许分流器

  这种办法相似于加了一个同享集线器,不同点是TAP链路仅仅接纳流量,不答应监测东西宣布流量。

  TAP和分流器这2个词有时分可以交流,尽管分流器一般应用于光纤链路。在光纤链路上,分流器会把光在初始途径和监测途径上进行分光。典型的分光比率包含80:20、70:30以及50:50。以80:20为例,80%的光经过分光器持续传送到原始途径,20%的光转发到监测途径。假如光纤原本就有问题,或许传输的间隔很长的话,光分流器带来的20%光丢掉,很简略形成链路呈现问题。分流器在光纤链路上很简略就会带来3 dB的衰减。有些分流器要经用一些,因而即便在链路的一端装置分流器形成链路中止,还可以将其换到另一端去装置,让链路正常作业。光分流器不需求电源就可以作业。需求留意的是,分流器是带内(Inbound)监测设备,所以分流器的线缆正确衔接就十分重要。

  电口的TAP也会带来信号丢掉的问题,由于TAP需求信号来辨认经过的流量。对电缆来说,这相当于增加了衰减,假如链路自身已经有必定问题或许链路很长的话,TAP的引进有或许会形成衔接中止。电口的TAP作业需求电源,信号被康复偏重传到监测端口。假如规划的好,在TAP掉电的时分,链路应该也不会中止。

  对链路运用TAP进行监测的办法是一个很好的查看链路流量的办法。一旦装置成功,TAP对被监测的设备来说便是通明的,可以随时运用,而且不会带来更多搅扰。不幸的是,在接入TAP的时分,链路有必要暂时中止。此外,TAP或许分流器会依照2个独立的方向供给流量。也便是说,发送和接纳是分隔的。

  为了一起监测经过TAP链路的恳求及呼应,需求一个带两个输进口的监测东西。双端口的监测东西可以别离监测每个方向,也可以把两个方向的链路会集在一起剖析。您也可以挑选每次只监测一个方向的流量,但这样剖析起来会比较困难。对TAP来说,监测全双工链路和半双工链路,操作上没有什么差异,都可以监测。您可以挑选一个单端口的监测东西,监测单一的方向,或许挑选一个双端口的监测东西,一起的监测两个方向。

办法5:用SNMP查询交流机

  对一个交流网络进行毛病诊断的最有用办法,应该是经过直接问询交流机来查看网络的情况。这可以经过SNMP或许衔接到交流机的操控口完成。明显,直接衔接到交流机的操控口不是抱负的办法,由于这就需求对网络中的每台交流机都有物理上的衔接。略微抱负一点的代替办法是建立衔接到交流机操控口的终端服务器。安恒公司SNMP是一个更好的挑选,它可以在交流网络带内的任何地方进行查询,不需求附加的硬件。假如您布置了网管体系,还可以装备当运用率、过错、或许其他参数超越门限的时分,交流机自动宣布SNMP圈套。然后运用网管或许监测东西,研讨是什么原因形成了门限超出。

  事实上简直一切的交流机都供给SNMP功用,哪怕是最廉价的交流机。它们之间首要的差异便是供给的信息多少。一些价格廉价的交流机只供给简略的SNMP信息,且是针对整个交流机的;而那些价格贵一些的交流机,还可以供给交流机每个端口的详细信息。

  SNMP或许是监测交流网络最常用和搅扰最少的办法。SNMP操控台不需求十分接近被监测的设备,只要求有路由可达就可以了,一起交流机的安全装备答应操控台与交流机的署理进行通讯。

图6、运用SNMP监测交流机安

  尽管交流机可以辨认到过错,但交流机自身并不守时地陈述过错,所以运用SNMP查询或许是最好的办法。

  支撑SNMP的交流机有不同的MIB库(办理信息库)。每一种MIB都不同。除了某些对自己的交流机供给支撑的私有MIB库,规范的MIB库对交流网络的监测也十分有用。下面是对毛病诊断十分有用的一些MIB库。

RFC 1213 – MIB II

RFC 1643 – Ethernet-Like Interface MIB

RFC 2819 – RMON Ethernet

RFC 2021 – RMON 2

RFC 2613 – SMON

  许多RFC生成之后就不断地在更新和增强。因而咱们要查看最近更新的RFC。例如RFC1213,至少更新和增强了五次,生成了5个新的RFC(2011,2012,2013,2358和2665)。除了界说运用率和过错的RFC之外,有关桥接的MIB(RFC1493)也是十分有用的。

  运用SNMP监测网络的时分,有必要留意安全性。假如SNMP署理没有约束,那么潜在的任何地方的任何人都可以监测到您的网络动态或修正交流机装备。交流机售出的时分默许打开了SNMP,而且运用的是一个十分通用的暗码。SNMP暗码叫做通讯字符串,运用明文传达,这带来了潜在的风险。SNMP V3供给对通讯字符串的加密,削减了这种风险,可是SNMP V3还没有广泛运用。最常用的通讯字符串是public。现在,运用public,许多Internet上的SNMP署理都可以被接入。

  咱们应该当即修正通讯字符串。SNMP署理应该为不同的字符串装备不同的接入等级,不同的IP地址、不同的子网也有不同的接入等级。或许依据其它的装备来约束接入的等级。经过路由器接入SNMP署理或许会对SNMP的约束带来一些影响。防火墙也有或许彻底阻挠SNMP。即便您可以经过SNMP接入署理,也要求署理支撑您所要查询的MIB库。大部分厂家彻底支撑规范的MIB库。可是,也有一些厂家不支撑。有时分为了支撑希望的MIB,还需求先对交流机的操作体系进行晋级。这种办法还有一个问题,假如SNMP署理履行的MIB不正确的话,那么呼应就彻底是过错的了。尽管这并不是常常产生的,但有时分程序规划的过错,会带来过错的呼应。

  交流机不呼应SNMP的查询有许多原因。一旦这些问题都处理了,SNMP就可以供给十分有用的监测和趋势剖析。

定论

  毛病诊断的一个遍及办法是等候用户的投诉。这个办法尽管简略,可是十分有用。用户可以感知到网络正常的功用是怎样的。一旦有功用下降,网络支撑中心就会很快收到客户的投诉。有了用户投诉,您就应该从他的接入点开端做毛病诊断了。这种办法的缺陷是彻底是被迫的,不具有前瞻性的。

  抱负的办法是运用前瞻性地监测。包含定时地查询每个交流机、监测每个交流端口的流量、流量的趋势,一起检测其他的相关网段。把问题处理从毛病诊断办法变成毛病防备办法。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/ziliao/sheji/185746.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部