HCIP-23.8 故障排除

数通

网络基础设施的平稳运行对于大多数现代企业来说都非常重要,由于网络故障而导致的业务中断常常意味着产出、利润和声誉的损失,因而PDIOI模型把网络故障排除作为其中一个重要的组成部分

PDIOI与网络故障排除

HCIP-23.8 故障排除-下一朵云

  • Operate:日常维护、故障排除

结构化的故常排除流程

image-20241030102132428

非结构化的故常排除流程

image-20241030102202868

TCP/IP参考模型与网络故障排除

image-20241030102800793

  • TCP/IP参考模型是网络故障排除的理论基础,OSI参考模型的物理层和数据链路层也是需要我们关注的。推荐的故障排除方式是从TCP/IP参考模型的网络接口层和网络层分割,确认并测试业务流量的路径,然后采用自顶向下或自底向上发进行故障排除。

以业务流量路径为核心的故障排除思想

7.11-23

自顶向下法

image-20241030103219296

如果网络层的连通行没有问题,可以使用自顶向下发进行故障排除。

  • 在确认业务流量路径的过程中,同时也验证了网络层的连通性。
  • 如果网络层的连通性没有问题,可以自顶向下法进行故障排除,即从应用层开始,对比相同应用的工作状态,检查时候存在应用层代理、应用层防火墙等导致故障的因素。

自底向上法

image-20241030103538125

如果网络的连通性有问题,可以使用自底向上法进行故障排除

  • 如果网络层的连通性有问题,说明网络层的下一层或网络层本身可能存在问题。这时可以使用自底向上法进行故障排除。在物理层检查是否存在网络线缆故障等问题;在数据链路层检查是否存在二层环路故障,链路层协议不匹配等问题;在网络层检查是否存在路由协议配置错误,防火墙过滤等问题。

对比配置法

R1:

dis isis 1 brief

R2:

dis isis 1 brief

替换法

image-20241030104021734

替换法是检查硬件问题的常用方法

分段法

image-20241030104056613

环路故障

环路如果导致广播风暴会造成用户通信质量较差,甚至通信中断。

image-20241030104606131

可能会有如下现象产生:

  • 设备无法远程登录

  • 在设备上使用display interface 命令查看接口统计信息时发现接口收到大量广播报文

  • 使用串口登录设备进行操作时,操作比较慢

  • CPU占用率超过70% dis cpu-usage 、 dis memory-usage

  • 通过ping进行测试,丢包严重

  • 设备上发生环路的VLAN的接口指示灯频繁闪烁

  • PC机上能收到大量广播报文

  • 设备部署环路检测后,设备出现环路告警

本类故障常见原始主要为设备线缆连接错误导致的

可采用如下方式确认存在广播风暴的接口

  • 通过观察接口的指示灯状态,如果频繁闪烁,可以判断接口可能存在广播风暴

  • 在设备上执行dis int brief命令,查看接口接收方向和发送方向最近一段时间的带宽利用率,显示“InUti”字段标识入方向上的带宽利用率,“OutUti”字段标识出方向上的带宽利用率。接口接收方向和发送发现最近一段时间的带宽利用率接近100%的接口则可能是存在广播风暴的接口。

本文链接:https://www.orcy.net.cn/4248.html,转载请附上原文出处链接

暂无评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注