多年来,大多数棘手的网络路由问题都是通过以下方法解决的:在大多数供应商的设备中采用标准技术,或者部署更好的第三方软件。
比如,如果你的生成树网络占据了重要的位置,或者你离不开nProbe或者Wireshark,那么你就应该使用一个可靠的解决方案来解决之前需要几个小时才能修复的问题。IEEE 802.1D支持无环连接,而Wireshark可以通过简单的操作清理任何数据包。然而,即使有这么多成熟的网络管理技术和工具,仍然有一些网络路由问题需要通过安全外壳进行管理和调试。路径分析就是一个很好的例子。
网络便利工具
也许我们不会像灭火器一样在墙上安装淡蓝色的网线,但是每个管理员都知道马上去哪里找。要解决走线问题,需要通过命令行界面反复查看状态表,而且总是需要绕着机架走。你甚至可能需要连接几个设备的控制台来追踪路线。然而,这些方法可能无法解决路由调试的真正挑战。看来路由问题经常发生,找到问题根源最有效的方法就是实时获取错误信息。
即使您配置了良好的系统日志警报,许多路由更改也只会每隔几天发生一次,因此很难捕捉到它们。而且,用户并不是报告路由错误的最佳来源:当页面加载缓慢或聊天应用明显延迟时,他们只是向周围的人抱怨(尽管一些VoIP客户在传输路径出现抖动或丢包时会故意给出主观低分)。于是,问题就产生了:“如何在网络路由出现问题时,定期查询路由表并得到报警?”
路线解析的影响
网络的实际路由包含许多因素,这些因素会(但不总是)以各种方式相互影响。路由协议、开放最短路径优先、边界网关协议、增强型内部网关路由协议和静态配置都会影响最终路由。本质上,它们共同构成了一个虚拟配置。然而,最终的“物理”路由只能在一个地方得到验证:路由表。但是谁有那么多时间整天盯着所有设备的路由表(而且也没有理由这么做)?
首先,每当路由改变时,它将迫使路由器重新计算网络拓扑,因此网络将充满更新的数据包。这可不好。其次,路由变化检测通常发生在问题发生后,所以你必须花时间查看每个路由叶子节点,以了解几个小时前发生了什么。有时,路由更改可能会降低流量传输速度,因此路由可能会回滚到性能较差的前一条路由。有时,这些更改可能会切断链接或中断关键用户服务。
幸运的是,许多网络性能监控解决方案可以轻松访问被监控设备的路由表。因为它们可以感知路由变化,所以您可以接收警报、生成报告或直接查看路由表,而无需连接到控制台。将它们与网络拓扑发现工具相结合,您可以监控每个终端的完整流量路由,并检查接口连接环境的路由细节。一层网络是否还是所有问题的根源,从一个服务器到一个连接信号灯不亮的端口跟踪中断的包流,不需要管理员离开自己的工位。变更历史报告和变更路线视图通常是免费的。
当然,当路由发生变化时,发送系统日志消息是很方便的,但是您仍然必须监控日志以捕捉有时难以及时理解的变化。为了节省您的时间,请花一些时间来配置路由监控工具,发送与实时更改相关的警报,并跟踪其更改历史。这样,您可以更快地修复问题,并消除控制台连接方法。