首页|傲世皇朝注册|平台
首页|傲世皇朝注册|平台
全站搜索
 
 
新闻详情
 
当前位置
首页.闲乐娱乐.首页
作者:管理员    发布于:2023-08-04 17:15    文字:【】【】【
       

  首页.闲乐娱乐.首页能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护和管理人员来说是个挑战。这不但要求对网络协议和技术有着深入的理解,更重要的是要建立一个系统化的故障处理思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。这需要各位工程师在维护和管理网络设备的实践中不断积累排错知识与经验。

  明确地定义什么是网络的“故障”和“排错”不是一件容易的事情。网络的”故障”往往是在某种应用不能正常实现时感知到的,有的业务场合,要迅速地找到故障并加以排除的要求是相当严格的。除了设备在正常运行中出现故障的情况外,还有另外一种情形,当我们在实施某种应用,已经完成了配置(不管你对配置是不是十分地有把握),但却得不到预期的效果。对于上述恼人问题的处理,把它们总结出来,叫做排错技术。显然,这与完全不知道如何配置网络设备是两回事。因此要求阅读本篇文档的工程师有一定的网络基础,并具备了基本的网络设备配置能力。

  1)应该得到什么预期的结果?我们真的知道自己操作后想得到什么结果吗?如果网络设备的接口物理协议和链路协议没有UP,在网络设备上能PING通该接口的地址吗?如果熟悉产品的配置和相关标准协议的内容,工程师应该对这些问题能够正确回答。

  2)目前处于什么状况?弄清设备发生故障处于什么状态是一个起码的要求。观察网络设备的各种指示灯是获得网络设备状态的一个初步的方法,更详细的是通过命令行界面与设备直接“对话”。如果需要,还要与网络使用者周边的部门协调,以便获得整个网络的信息。再次强调,无论是自行解决问题还是要寻求技术支持,弄清故障前与故障发生时的网络状况是一个最基本的要求!

  3)导致结果的偏差有哪些可能?回答这个具有挑战性的问题不光需要勇气,更需要学识和经验。无论哪种情况,本文档将从实用的角度,提供一些有益的建议和参考。当然,对原因的全面可靠列举,需要对特定网络和设备的状况做全面的了解。

  4)如何排除一些假象,从而定位导致偏差的真正原因?针对偏差列出的可能原因与真实情况越接近,对这个问题回答也越容易。这可以归纳出过程框图对它加以回答。

  该处理流程是网络维护人员所能够采用的排错模型中的一种,如果各位工程师根据自己的经验和实践总结了另外的排错模型并证明是行之有效的,请继续使用它——网络故障解决的处理流程是可以变化的,但要遵循故障处理有序化的思维模式。一个合格的网络工程师应该在处理故障的时候,向自己提出上述问题,冷静地加以分析,提出方案并细心地逐一检验。这样,各位工程师能在问题解决的过程中增加经验,同时得到职业的满足感。

  单体故障相对容易判断。它一般与本台设备以及附件的物理故障相关,比如电源的问题导致机器不能运转,线缆的原因导致网络接口不能检测到正常的信号。除了物理原因外,一种极端的情况是网络设备存在性能问题,例如处理过大的NAT(网络地址转换)表或路由表,导致网络设备CPU负荷过高。

  另外一方面,日益复杂的网络应用环境对网络的维护提出了更多的要求。例如病毒的攻击即使目标不是网络设备,也可以导致网络设备的CPU占用率过高,从而影响业务处理的性能。所以在故障处理中,不论对于连通性的故障还是性能上的问题,全面系统地了解网络情况是一个重要的要求。

  这里的分层与OSI的七层标准一致。系统的排错处理思想提供了故障处理的步骤与原则。分层的思想有助于工程师将精力放在正确的关注点上。上面提到,故障往往是因为用户无法使用某个网络应用而发觉的,但造成应用故障的原因可能发生在任何层次上。一个WINDOWS 客户端不能访问服务器,既可能是数据库特定信息没有转发,也可能是路由的问题,甚至就是中间网络设备的物理原因。另外一个典型的例子是ADSL链路的调试,链路层协议不能UP,有可能是配置的原因(比如PPPOE 账户口令配置错误),但也有一种常见的可能是物理链路有问题,也许当前最重要的事就是通过替换的方法来查找线. 网络设备软件升级的意义

  用户可能会对升级网络设备的软件版本也是解决故障的一种手段表示不解与惊讶。当今的电子世界,软件几乎主宰了一切。就象PC的操作系统一样,以锐捷网络为例,其数据通信产品中的操作系统叫做RGNOS。随着新技术与产品的发展,软件工程师正不断地丰富RGNOS的特性并在努力提高它的可用性、适应性与健壮性。所以,对于某些特性(比如VPN),当您排除配置的错误后,如果还没解决问题,您升级到较新的RGNOS版本继续排错,应该是很好的建议。

  要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,因此工程师要向受影响的用户、网络人员或其他关键人员提出问题:

  故障处理系统化的基本思想是系统地将故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。

  在确认用户网络故障点时,分段故障处理法是工程师优先采用的方法,也是高效的方法,我们通常使用PING命令来判定如下几个关键信息:

  主机自身所在网段的网关三层设备到路由器LAN接口的这一段是否可PING通

  主机自身所在网段的网关三层设备到路由器WAN接口的这一段是否可PING通

  目前网络应用中,从安全因素考虑,许多网络设备启用了禁PING功能,此时会误导对故障的分析,请各位工程师留意!在本文的案例分析中,都不会考虑到禁PING这种特殊情况。

  分层法思想很简单:当OSI模型的所有低层结构工作正常时,它的高层结构才能正常工作。在确信所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。各层次的关注点:

  物理层:线缆、连接头、网络接口,这些都是可能导致端口处于down状态的因素。我们通常使用show interfaces命令初步判断物理层的状态。

  数据链路层:数据链路层负责在网络层与物理层之间进行信息传输。封装的不一致是导致数据链路层故障的最常见原因。可以使用show interfaces命令初步判断数据链路层是否存在故障,此外,在PPPOE 封装的以太网接口上,接口MTU值配置错误会导致网络层或应用层的异常。

  网络层:地址错误和子网掩码错误是引起网络层故障最常见的原因;网络中的地址重复是网络故障的另一个可能原因;在目前ARP病毒高发区域,ARP信息学习错误也是造成网络异常的重要原因。另外,路由协议是网络层的一部分,在较复杂的网络中是排错重点关注的内容。我们可使用sh ip interface命令初步判断路由口的状态;sh int vlan命令初步判断SVI的状态 sh ip route命令初步判断路由表的状态。

  传输层:NAT工作是否正常、应用使用的TCP/UDP端口是否受到屏蔽。

  在一个封装PPPOE 的以太网接口上,由于物理层的不稳定,PPPOE连接总是出现反复失去连接的问题,这个问题的直接表象是到达远程端点的路由总是出现间歇性中断。

  这使得维护工程师第一反应是路由协议出问题了,然后凭借着这个感觉来对路由协议进行大量故障诊断和配置,其结果是可想而知的。如果他能够从OSI模型的底层逐步向上来探究原因的话,工程师将不会做出这个错误的假设,并能够迅速定位和排除问题。

  网络设备的配置文件的组织结构,是以全局配置、物理接口配置、逻辑接口配置、路由配置等方式编排的。可以以此作为故障定位提供了一个原始框架,当出现一个故障现象时,可以把它归入上述某一类或某几类中,从而有助于缩减故障定位范围:

  当使用show ip route命令,结果只显示出了直连路由,那么问题可能发生在哪里呢?根据上述的分块,我们发现有三部分可能引起该故障:路由协议、策略、端口。如果没有配置路由协议或配置不当,路由表就可能为空;如果访问列表配置错误,就可能妨碍路由的更新;如果端口的地址、掩码或认证配置错误,也可能导致路由表错误。

  这是在检查硬件是否存在问题时最常用的方法。例如:当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是用户PC问题时,更换一台确定是好的PC试一试;当怀疑是接口模块有问题时,更换一个其他接口模块试一试。

  用户终端问题(网络参数配置错误、网卡异常,系统异常,应用程序工作异常等)。故障现象:故障只发生在单个用户处。判断方法:使用替换法,将故障PC所使用网线连接到测试PC上(确定配置正确的网络参数),故障现象不会重现;线路还原到故障PC上,故障现象立即重现。

  服务器问题(网络参数配置错误、网卡异常,系统异常,应用程序工作异常等)。故障现象:所有用户无法访问服务器,或者无法访问服务器的某个应用。判断方法:对本地服务器,使用替换法,将一台测试PC与服务器直接通过双绞线(确定是好的网线)连接,如果此时故障依然存在,说明服务器存在问题。对异地服务器,我们通常使用分段法与分层法:在多处(非本企业内部)ping该服务器的IP地址不通或丢包严重,或者也无法访问该服务器提供的应用。

  对用户终端问题与服务器问题的处理方法在本文档中不做过多讨论,以下文档将主要对网络设备问题与外界因素问题做出详细分析,提出指导性的处理方法。

  网络设备的安装和使用注意事项应该严格按照安装手册进行。安装前应检查安装场所的温湿度、洁净度、静电、干扰、防雷击等要求是否满足;安装后应检查电源的输入电压幅值及保护地、接地电阻等是否满足要求;使用过程中的维护如:升级CTRL与RGNOS主程序、功能模块接口卡的更换等,要严格按照维护流程操作。具体规范和要求请参照各系列网络设备安装手册。

  网络设备的整机和接口模块在出厂前已做过严格的检验,不会发生有故障的网络设备流入市场。所以此时的故障绝大部分是由运输、仓储等环节的环境不满足要求所至;少部分是由插拔模块或电缆不当导致接插件硬性故障引起;极少部分是由软件不能正常引导引起。有可能发生的故障点:

  以锐捷为例,其网络路由器设备的可升级软件为RGNOS主机软件,交换机设备的可升级软件包括CTRL层软件和RGNOS主机软件两类。

  由于网络环境的日趋复杂,病毒攻击已经成为网络排错和维护不得不考虑的因素。病毒和非法报文通过三层设备转发,将占用三层网络设备,特别是在出口路由器上的大量资源,从而影响正常业务。如果路由器的CPU使用率过高,PING路由器内网LAN口IP丢包,上网慢,建议通过断开本地局域网后查看路由器的CPU使用率、使用SNIFFER抓包等手段来判断是否有本地攻击的情况发生。

  ARP欺骗类型的病毒主要造成用户无论访问内部网络资源还是访问外部网络时,都会出现网络频繁掉线,且该网络故障一般发生在一个网段,确切的说是在同一个VLAN内。

  能PING通网内其它客户机,但PING不通路由,上不了外网。能PING通网内其它客户机,同样PING不通路由,但能上外网。在PC机执行arp -a 命令,检查网关IP对应的MAC地址,如果发现有两个不同的MAC对应一个IP,或网关设备的MAC信息与网络正常时的MAC信息不一致,此时可肯定网络内存在ARP欺骗。

  您可以根据病毒类型在网络设备上通过一些配置,减轻病毒对网络应用造成的影响,一般会起到一定的效果。当然,最根本的解决方法是本地进行彻底地杀毒。

  在网络设备初次部署中,出现网络设备功能与预期规划不一致时,在排除物理故障后,首先判断设备配置是否正确。

  在故障处理时,工程师要根据所列出的可能原因制定故障排查计划,分析最有可能的原因后,确定一次只对一个变量进行操作,这种方法能够重现某一故障的解决办法。如果有多个变量同时被改变,而问题得以解决,那么如何判断哪个变量导致了故障发生呢?

  当对某一原因执行了排错方案后,需要对结果进行分析,判断问题是否解决,是否引入了新的问题。如果问题解决,那么就可以直接进入文档编写过程;如果没有解决问题,那么就需要再次循环进行到故障排查过程。

  当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施。

  文档是排错宝贵经验的总结,是“经验判断和理论分析”这一过程中最重要的参考资料。

  如果是非PC问题,在故障PC上访问提供类似服务的其它服务器,确定是否是服务器自身的原因。

  如果故障定位在网络层之下,用分段法将PC到要访问的服务器网络路径分段,使用PING命令诊断。

  1.PC-------PC所在网段网关三层设备LAN接口的这一段状态是否正常?

  PC-------PC所在网段网关三层设备LAN接口的这一段是否可PING通?

  PC-------服务器所在网段网关三层接口的这一段是否可PING通?

  PC所在网段网关三层设备-------服务器网络接口的这一段是否可PING通?

  PC所在网段网关三层设备-------要访问资源的IP这一段是否可PING通?

  这样通过分段法我们可以初步排断问题出在何处。如果故障定位在网络层之上,一般用替换法与分块法处理:查看各段设备上的安全配置(ACL),路由器上的NAT配置。确认设备没有屏蔽应用需要使用的端口。

  网络设备上应用的ACL屏蔽了应用使用的端口。出口路由器NAT表项错误。

  sh run查看设备配置;sh ip nat translation查看设备NAT表。

  对网络层之上问题的分析,要求工程师对排查的网络应用软件有一定的了解。在诊断时,一定要向网络管理员,直接用户了解相关应用软件的情况,TCP/UDP 端口号,基本工作模式等信息。

  用户反映其有一个网段的用户不能上网,而同时另外几个网段的用户能上网,该故障近两天反复出现,且有时故障会自行消失。

  用户反映其所有网段的用户能上外网,但不能访问本企业内部服务器;公网用户也不能访问企业内部对外发布的服务器;同一服务器网段内的机器能相互访问。

  在用户机器上ping通服务器所在网段的网关地址,说明PC到服务器连接的三层设备正常。

  用户反映其外网线路从ADSL调整到电信光纤专线,光纤直接连接到NBR1000E路由器光模块上,调整配置后,PING电信IP 地址一直不通。将光纤用光纤转换器转换到双绞线,连接到一台PC,PING电信对端测试正常。

  用户反映该处新接入外网,使用一台NBR2000。通过配置向导完成配置后,所有用户不能访问内部服务器,但不能外网。

  用户反映当天开始计算机不能上网,更换了另外一台计算机也不行。打开网页失败。

  在路由器上 sh cpu,发现CPU利用率历史峰值到了90%以上,询问网管,该峰值时间与故障发生时间基本一致。

  在路由器上 sh cpu,发现CPU利用率历史峰值只有50%左右,有游戏用户反映掉线时,CPU利用率也不高。

  用户反映其内部网络刚刚进行了扩容,汇聚使用的我司S3750交换机,为了节约成本,一部分接入交换机使用了其它品牌H的低端设备。扩容完成后,发现由H设备接入的用户上网速度非常慢,用户下载文件时速率通常只能达到20~30kBps,用户Ping路由器地址有丢包的现象,且不丢包时的延时也不稳定。而接在我司设备下边的用户下载速度能够达到100~200kBps.网络使用也正常。

  用户反映突然无法访问外网与内网服务器,全网网络速度都变缓慢,过几分钟后,全网网络应用中断。

  用户反映所有用户突然感觉上网速度缓慢,个别游戏掉线。每天该故障都会反复出现,且故障发生的时间不固定,但上网人越多,发生故障的次数越多。因此用户对我司路由器性能提出质疑。

  在路由器上 sh cpu,发现CPU利用率历史峰值到了90%,询问网管,该峰值时间与故障发生时间基本一致。

相关推荐
  • 万尚娱乐注册-地址
  • 首页.闲乐娱乐.首页
  • 腾耀娱乐注册-平台注册
  • 首页!「聚星注册」!首页
  • 首页,宗盛娱乐挂机
  • 首页:欧亿娱乐挂机
  • 首页、玄武注册注册、首页
  • 首页*利澳注册*首页
  • 首页:万和城注册注册:首页
  • 首页“「久洲注册」”首页
  • 脚注信息
    友情链接: