网络管理常见故障及排除办法

通信网络

650人已加入

描述

随着视频应用的快速发展,网络实时性能的重要性也不断攀升,然而,丢包、抖动、缓冲和网络复杂性等问题让网络仍然面临性能不佳问题。   网络性能评价取决于用户对实时流量延迟的容忍度等因素,不同的应用程序表现不同,对延迟的容忍程度也不同。例如,实时交互类游戏玩家以及某些过程控制玩家可能对延迟的忍耐度不超过 4 毫秒,而音视频会议大概在 20 毫秒。网络管理和运营人员必须知道网络上的流量是什么,流向哪里,以及底层的应用需求。   以下是与网络性能挑战相关的主要网络问题以及如何解决这些问题。    

丢  包

    可能会出于各种原因导致丢包,例如双工不匹配、光纤脏污、光纤分路不良、电缆受压或过长、配置错误等等。   举个例子,某1Gb 校园光链路每天都会出现少量错误,并在此后几月内逐渐增加,并在不久后导致了严重的数据包丢失。最后调查显示是电线坏了,修复后,错误消失。   在现实生活中,很小的错误率对基于 TCP 的应用都会产生很大影响,在 1000 公里及以上距离的 1Gb 链路上,需要将错误率保持在非常低的水平。    

网络拥塞

    拥塞也会导致丢包。网络设备通常利用缓冲区消化数据包突发,但缓冲区对所能容纳的数据包量有限制。如果超过该限制,就会导致数据包丢失,这种类型的拥塞在网络中很常见。   即使像高速链路等优质网络,微突发也会造成拥塞,导致非常短暂的拥塞。虽然不常见,但这确实会影响应用程序。   造成拥塞的其中一个原因是链路速度不匹配,较好的解决方案是使用QoS根据流量的特性进行优先级排序。应用程序会产生不同类型的流量,特定类型的流量可能会导致问题。QoS 优先级需要对数据包进行排队,并让某些队列先通过,但它只适用于造成拥塞的流量。    

Bufferbloat

    Bufferbloat是因为缓存过多导致抖动。这表现为数据包到达太晚,无法播放语音或视频,并降低了基于TCP的应用程序的速度。举个真实的例子,大型 CAD 文件需要很长时间才能传输到远程工作站,某企业将链路从存储服务器升级到 L3交换机,从1Gbps 升级到10Gbps。然而,广域网继续以1 Gbps 的速度运作。最后调查显示,交换机实际上是以 10Gbps 的速度输入,但只以 1Gbps 的速度输出,在这个过程中许多数据包丢失了。这种情况下的解决方案是配置一条端到端的1Gbps路径,能够防止过多的丢包。   检测 bufferfloat 的方法是执行长时间运行的 ping 测试,以发现平均往返时间并同时开始大文件传输。如果在测试期间 ping 测试结果变长,则说明正在发生bufferbloat,解决方案是升级TCP软件以提供主动队列管理。    

 

高延迟

    单向延迟率大约为每 1,000 公里 10 毫秒。减少延迟的一种简单方法是将客户端和数据移动到一起,例如将 CDN 用于静态内容。此外还可以使用地理DNS将客户端定向到最近的应用程序服务器。    

Wi-Fi 设计和实现不理想

    好的 Wi-Fi 往往需要专业的现场调查来指导设计和实施。需要考虑的因素包括管道、电梯和建筑钢材等金属结构的反射,以及其他 Wi-Fi 节点的干扰。同时,必须正确放置接入点。   注意事项:不要将接入点绑在金属天花板上,因为反射面会影响信号;有些天花板很高,以致于Wi-Fi 信号很弱;在仓库等需要的地方使用定向天线,安装在墙上可以将信号发射到过道。   此外,应使用正确的频段以避免接入点之间的干扰。5GHz 和 6 GHz 频段的信道比 2.4 GHz 多,因此更容易确保它们不会相互干扰。    

日益增长的网络复杂性

    根据 Chetan Sharma Consulting 分析师 Chetan Sharma 的说法,到 2030 年,边缘经济的价值将达到 4.1 万亿美元,这将对网络管理产生巨大的影响。   此外,目前的网络管理和故障排除需要处理物联网(IoT)传感器和设备以及容器化应用程序。   Alef首席执行官Mike Mulica表示:“由于没有与服务相关的特定设备,网络管理系统对服务可用性一无所知。”“服务与设备之间的关系正在被分解,现有的网络管理框架必须随着新框架的开发和实现而改变,这些新框架跨越堆栈的不同层,并在多云环境中提供跨多个域的协调。”  
  编辑:黄飞

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分