首页|傲世皇朝注册|平台
首页|傲世皇朝注册|平台
全站搜索
 
 
新闻详情
 
当前位置
交换机在网络中的故障诊断
作者:管理员    发布于:2022-08-16 19:48    文字:【】【】【
       

  交换机在网络中的故障诊断 在一个交换网络里, 您如何确定从哪里开始动手查找问题?想深入“透视” 一个交换网络是非常困难的。首先,在 2 层交换的时候还是桥接转发方式,但到 了 3 层交换却有了更高级的特性和转发规则,例如 VLAN。 到了 4 层交换,就更加复杂了,出现了更高级的转发和负载均衡技术,故障 诊断故障诊断和解决就需要更多的交换机配置知识。 在安装完一台交换机后, 每个交换机的半双工端口就构成了一个冲突域。如 果该端口连接了一个集线器,集线器下面连接若干站点,那么冲突域会扩大。但 随着交换产品的价格下跌, 现在大多数新建的网络每个交换端口都只连接一个站 点。因此,在半双工连接情况下,冲突域仅针对一个单独的电缆链路。 交换机通常是一个独立广播域的一部分, 包括串连或者并连的任意数目的其 他交换机。如果使用了 OSI 模型 3 层的功能,就可以创建多广播域,广播域的数 目与 VLAN 数目相等。最极限的情况,如果交换机功能允许,每个端口可以配置 为一个独立的广播域。 可以把这种情况描述为路由到桌面。为每个端口创建一个 独立的广播域后, 故障诊断就会严格受限。但是如果我们把每个端口设置为一个 单独的广播域,交换机在转发流量的时候,每个端口都需要路由服务,这会占用 交换机 CPU 的有限资源。 在网络环境中,对每个单独的端口进行路由请求和应答 是非常困难的,我们应该避免这样的配置。不幸的是,这种情况在实际情况中非 常常见, 网络中经常发现服务器全部在一个子网或者广播域中,所有的客户在另 外的子网或者广播域中。在这种情况下,所有的请求都必须路由。如果维护行为 限制在一个单独的服务器群里,那么考虑把服务器放进单独的 VLAN 里。然后把 使用这台服务器的用户放到同一个 VLAN。这样就可以使用 2 层交换的桥接方式 来交换流量,只有很少的请求需要路由。如果服务器支撑多于一个用户区,可以 在服务器上多装一块网卡来实现到用户的 2 层交换连接。 对交换机进行故障诊断的 5 种技术 可以采取 5 种基本方式来透视交换机。每一种方法都不同,都有积极或者消 极的一面。类似在网络中遇到的其他问题一样,没有一个最好的答案。最合适的 方案往往取决于您手中可以利用到的资源 (什么工具可以使用或者以前安装过什 么工具),而且使用这些技术有可能造成服务中断。 即使把这些方式组合起来, 也不能监测到所连接的网络, 在交换的环境里面, 也不像集线器那样方便监测。我们几乎不可能看到通过一个交换机的全部流量。 大多数的故障诊断会假设流量会在站点和所连接的服务器之间或经过故障诊断 交换机 uplink 口通过。而实际上如果 2 台主机直接传输信息的话,就不会使用 交换机的 uplink 口或者任何其他的端口来交换流量。除非你知道具体用到哪个 端口,否则是监测不到的。 举个例子,如图 1,一台服务器接入一台交换机。在反映有问题的用户中, 一部分是直接与这台交换机相连,另外的一部分用户是由这台交换机的 uplink

  口从其他路由器或者交换机连接上来的。故障报告是访问服务器“慢”,这样的 故障报告对技术支持工程师来说基本上没有任何价值。

  图一、一个最基本的交换机环境 方法 1:通过 TELNET 或者串行口接入服务器 高级的网络技术支持工程师或其他知道交换机密码的人在进行故障诊断时 可以选择通过 TELENET 或者交换机的串口登陆, 来检查交换机的配置。 (如图 2)

  图 2、使用 RS-232 控制端口 交换机配置可以通过上面提到的 2 种方法查看,虽然问题不一定是配置引起的。 不管问题是操作系统有 BUG 还是配置不完善,都不能从配置列表中轻易的查看 出。 配置信息在定位交换机是否像预期的那样运行上比较有用,但针对故障诊断 就不是了。 为了验证交换机的配置,往往需要使用多种的交换机故障诊断方法配 合。 很多交换机都带有实时的故障诊断工具,因为交换机生产厂家和型号的不 同,这些故障解决工具的特征也各不相同。但是要使用好这些工具,必须依靠一 定的理论知识和实际经验。 方法 2:连接到一个空闲端口 最简单的故障诊断方法是在交换机的空闲端口接入一个监测工具, 例如协议 分析仪。

  图 3、从任意端口监测 把监测工具接入交换机的一个空闲端口, 不用中断服务就可以查看所属广播 域。该监测工具与广播域里的其他站点一样有相同的权限。 不幸的是,交换机(做为一个多端口的桥接设备)几乎不转发流量到监测端 口。因为桥接设备就是这样设计的,流量直转发到所属的目的端口,不会去其他 的端口。协议分析仪因此几乎监测不到流量。

  图 4、 交换机在源端口和目的端口之间转发流量。 非常少的流量会转到其他端口。 站点和服务器之间可能每秒钟会转发几千个帧, 但是监测端口每分钟只能看到几 个帧。 转发到监测端口的流量几乎全部都是广播, 包含一些零星的目的地址不明的 帧。这些零星的帧是由于路由转发表老化的结果,经常是目的端口不明的帧。一 些经验不够的技术人员看到这么高的广播(接近 100%),却没有注意到端口利 用率很低,就误判网络出现了广播风暴,其实不是。 这样查看交换网络几乎没有用,因为监测工具必须获取流量。获得的流量或 者对广播域的查询对网络搜索和发现其他类型问题是有很有帮助的, 但对解决用 户连接慢的问题并没有多大的帮助。 对大多数交换机来说, 都有一个更好的选择,可以把需要监测的端口流量备 份到一个专门的空闲口。这种技术通常称为端口镜像。

  大多数交换机厂家都提供备份或镜像流量的功能, 可以把监测工具接入交换 机一个专门配置过的端口。老的交换机必须指定一个专门的监测口做为镜像口, 但现在大多数新的交换机可以指定任何一个端口做为镜像口。 虽然交换机厂家实现镜像的方式各不相同,但是有一些基本相同的监测选 项。值得注意的是,几乎在所有的情况下,交换机在转发流量到镜像口的时候, 同时把错误都过滤掉了。 对于故障诊断来说, 这意味着同时过滤掉了有用的信息。 此外,实际操作当中需要我们通过控制口(交换机的 RS232 端口),或者 Telnet 进程来配置镜像。这意味着除了监测工具之外,我们通常还需要带一台 电脑或者终端来对交换机进行配置。 镜像端口经常只是一个“监听”端口, 不过很多交换机厂家允许把该端口配 置成全双工的。 配置了镜像口, 监测工具就可以查看报告连接慢的主机和服务器 之间的实际流量的备份。 镜像口可以只监测交换机的任意一个端口,甚至可以是 Uplink 口,也可以同时监测交换机的多个端口。但是同时监测的端口很多的话, 过高的流量就有可能会超过镜像口的接收能力。 监测端口的输出能力是一个很重要的问题。镜像口可以收,也可以发。在配 置的时候,经常关掉了镜像口发的功能。但不管有没有关掉镜像口发的功能(不 管镜像口是全双工或者不是),镜像口的接收能力都是有限制的。如果被监测的 全双工端口的速率和镜像口是一样的话, 交换机在转发流量的时候很容易就会丢 包,但是交换机不会通知您。 假设您在监测一个以 100M 全双工速率连接到交换机的服务器的话,那么服务器 在全双工工作的时候,服务器的收发速率都是 100M,那么总共就有了 200M。然 而交换机的 100M 镜像口最多只能接收 100M 的流量。所以任何交换机的端口(全 双工的)利用率超过 50%的时候,镜像口接收到的包就会有丢失。 如果把多个端口镜像到一个端口,丢包的问题就会更加的严重。因为大多数 交换机都工作在低容量, 这个问题并不会被立刻注意到。大多数用户连接的平均 利用率都很低。只是偶尔会有流量的突发。 如果选择一个高速的镜像口, 就可以减少丢包的问题。 例如把图 6 中的 100M 镜像口换成 1000M,那么就可以很容易的接收 200M 的监测流量。 方法 3:在链路上接入集线器 使用集线器很具有战略意义。对很多网络来说,大多数发送和接收的流量都 来源于文件服务器之类的共享设备。 在交换机端口和文件服务器中间接入一个集 线器, 再把分析仪接入集线器, 实际上就把分析仪和文件服务器接入了同一个广 播域。如图 7 所示。使用这种方法,技术支持人员就可以看到文件服务器所有进 出的流量, 帮助技术支持人员解决一系列的问题, 包括用户登陆失败、 性能低效、 连接丢失等。

  图 5、使用集线器监测交换机端口 接入集线器的方法很多时候都不实用,特别是在需要监测多个服务器的时 候。在哪里接入集线器合适?所有的服务器都要连接吗?如果是用一个集线器, 换来换去连接的话, 您一定不希望您的网络这样频繁地被干扰。连接集线器所带 来的时延,经常会带来连接的丢失。另外,很多时候监测工具并不支持服务器所 采用的技术或者连接速率。 使用共享集线器监测一条链路上的所有流量和错误仍然是一个有效的方法。 这几乎是唯一一种可以在交换网络环境中实际查看和分析 MAC 层错误的方法。 使 用 SNMP 来发现这些错误也可以。但是,为了更好地进行错误分析,还是用监测 工具直接查看最直接。 接入集线 种主要缺陷。服务器链路有可能不是全双工的,或者 和集线器的端口双工状态不匹配,这会给监测带来更多的不愿意看到的错误结 果。而且使用这种方法时,手头必须要有一个共享集线器。现在很多新型的集线 器都类似于交换机,而不是共享的转发设备。接入这种新型的集线器,相当于接 入了一个新的交换机,您会看不到想要查看的流量,对监测起不到什么作用。安 恒公司如果接入的是双速率的集线M 双速率的,可能每个速率 都提供了一个广播域,两个速率之间再进行转发。在这种情况下,需要确认被监 测链路和监测工具运行在相同速率,才能够使用这种双速率集线器。还有一些集 线器提供在所有端口之间转发的功能,更因此把自己标榜为价格便宜的交换机, 给人造成误解。他们都不能用在这种监测方法上。 方法 4:使用一个 TAP(监测接口盒)或者分流器 这种方法类似于加了一个共享集线器,不同点是 TAP 链路只是接收流量,不 允许监测工具发出流量。 TAP 和分流器这 2 个词有时候可以互换,虽然分流器通常应用于光纤链路。 在光纤链路上, 分流器会把光在初始路径和监测路径上进行分光。典型的分光比 率包括 80:20、70:30 以及 50:50。以 80:20 为例,80%的光通过分光器继 续传送到原始路径,20%的光转发到监测路径。如果光纤本来就有问题,或者传 输的距离很长的线%光丢失,很容易造成链路出现问题。 分流器在光纤链路上很容易就会带来 3 dB 的衰减。有些分流器要耐用一些,因 此即使在链路的一端安装分流器造成链路中断,还可以将其换到另一端去安装, 让链路正常工作。光分流器不需要电源就可以工作。需要注意的是,分流器是带 内(Inbound)监测设备,所以分流器的线缆正确连接就非常重要。

  电口的 TAP 也会带来信号丢失的问题, 因为 TAP 需要信号来识别通过的流量。 对电缆来说, 这相当于增加了衰减,如果链路本身已经有一定问题或者链路很长 的话,TAP 的引入有可能会造成连接中断。电口的 TAP 工作需要电源,信号被恢 复并重传到监测端口。 如果设计的好, TAP 掉电的时候, 在 链路应该也不会中断。 对链路使用 TAP 进行监测的方式是一个很好的查看链路流量的方法。 一旦安 装成功,TAP 对被监测的设备来说就是透明的,可以随时使用,而且不会带来更 多干扰。不幸的是,在接入 TAP 的时候,链路必须暂时中断。此外,TAP 或者分 流器会按照 2 个独立的方向提供流量。也就是说,发送和接收是分开的。 为了同时监测通过 TAP 链路的请求及响应, 需要一个带两个输入口的监测工 具。 双端口的监测工具可以分别监测每个方向,也可以把两个方向的链路集中在 一起分析。 您也可以选择每次只监测一个方向的流量,但这样分析起来会比较困 难。对 TAP 来说,监测全双工链路和半双工链路,操作上没有什么区别,都可以 监测。您可以选择一个单端口的监测工具,监测单一的方向,或者选择一个双端 口的监测工具,同时的监测两个方向。 方法 5:用 SNMP 查询交换机 对一个交换网络进行故障诊断的最有效办法, 应该是通过直接询问交换机来 查看网络的状况。这可以通过 SNMP 或者连接到交换机的控制口实现。显然,直 接连接到交换机的控制口不是理想的办法, 因为这就需要对网络中的每台交换机 都有物理上的连接。 稍微理想一点的替代方法是搭建连接到交换机控制口的终端 服务器。安恒公司 SNMP 是一个更好的选择,它可以在交换网络带内的任何地方 进行查询,不需要附加的硬件。如果您部署了网管系统,还可以配置当利用率、 错误、或者其他参数超过门限的时候,交换机主动发出 SNMP 陷阱。然后利用网 管或者监测工具,研究是什么原因造成了门限超出。 事实上几乎所有的交换机都提供 SNMP 功能,哪怕是最便宜的交换机。它们 之间主要的区别就是提供的信息多少。一些价格便宜的交换机只提供简单的 SNMP 信息,且是针对整个交换机的;而那些价格贵一些的交换机,还可以提供 交换机每个端口的详细信息。 SNMP 可能是监测交换网络最常用和干扰最少的办法。SNMP 控制台不需要非 常靠近被监测的设备, 只要求有路由可达就可以了,同时交换机的安全配置允许 控制台与交换机的代理进行通信。

  图 6、使用 SNMP 监测交换机安 虽然交换机可以识别到错误,但交换机本身并不定时地报告错误,所以使用 SNMP 查询或许是最好的办法。 支持 SNMP 的交换机有不同的 MIB 库(管理信息库)。每一种 MIB 都不同。 除了某些对自己的交换机提供支持的私有 MIB 库, 标准的 MIB 库对交换网络的监 测也非常有用。下面是对故障诊断非常有用的一些 MIB 库。 RFC 1213 – MIB II RFC 1643 – Ethernet-Like Interface MIB RFC 2819 – RMON Ethernet RFC 2021 – RMON 2 RFC 2613 – SMON 很多 RFC 生成之后就不断地在更新和增强。 因此我们要检查最近更新的 RFC。 例如 RFC1213, 至少更新和增强了五次, 生成了 5 个新的 RFC (2011, 2012, 2013, 2358 和 2665)。除了定义利用率和错误的 RFC 之外,有关桥接的 MIB(RFC1493) 也是非常有用的。 使用 SNMP 监测网络的时候,必须注意安全性。如果 SNMP 代理没有限制,那 么潜在的任何地方的任何人都可以监测到您的网络动态或修改交换机配置。 交换 机售出的时候默认打开了 SNMP,并且使用的是一个非常通用的密码。SNMP 密码 叫做通信字符串,使用明文传播,这带来了潜在的危险。SNMP V3 提供对通信字 符串的加密,减少了这种危险,但是 SNMP V3 还没有广泛使用。最常用的通信字 符串是 public。现在,使用 public,很多 Internet 上的 SNMP 代理都可以被接 入。 我们应该立即修改通信字符串。SNMP 代理应该为不同的字符串配置不同的 接入级别,不同的 IP 地址、不同的子网也有不同的接入级别。或者根据其它的 配置来限制接入的级别。 通过路由器接入 SNMP 代理可能会对 SNMP 的限制带来一 些影响。防火墙也有可能完全阻止 SNMP。即使您能够通过 SNMP 接入代理,也要 求代理支持您所要查询的 MIB 库。大部分厂家完全支持标准的 MIB 库。然而,也 有一些厂家不支持。有时候为了支持期望的 MIB,还需要先对交换机的操作系统 进行升级。这种方法还有一个问题,如果 SNMP 代理执行的 MIB 不正确的话,那 么响应就完全是错误的了。 虽然这并不是经常发生的, 但有时候程序设计的错误, 会带来错误的响应。 交换机不响应 SNMP 的查询有很多原因。一旦这些问题都解决了,SNMP 就能 够提供非常有效的监测和趋势分析。

  结论 故障诊断的一个普遍方法是等待用户的投诉。这个方法虽然简单,但是非常 有效。用户能够感知到网络正常的性能是怎样的。一旦有性能下降,网络支持中 心就会很快收到客户的投诉。 有了用户投诉,您就应该从他的接入点开始做故障 诊断了。这种方法的缺点是完全是被动的,不具有前瞻性的。 理想的方法是使用前瞻性地监测。包括定期地查询每个交换机、监测每个交 换端口的流量、流量的趋势,同时检测其他的相关网段。把问题解决从故障诊断 方式变成故障预防方式。

相关推荐
  • 大摩平台怎么登录_大摩招商注册开户全教程
  • 首页.「摩鑫注册」.首页
  • 首页,恩佐注册挂机
  • 鼎点娱乐主管-首选注册
  • 首页〈天顺娱乐〉首页
  • 恒悦注册平台-在线注册
  • 首页[T6娱乐平台]首页
  • 欧陆娱乐-在线
  • 万恒娱乐-挂机
  • 宗盛娱乐-官方首页
  • 脚注信息
    友情链接: