众力资讯网

亮灯却断网?车间停摆真相太奇葩!一次上门排查揪出两个“隐形凶手”

“狂人,快来救救急!客户的网络老是断,今天是车间突然断网,生产线都停了!”一大早接到电信协同排查的电话,语气里满是焦灼。

“狂人,快来救救急!客户的网络老是断,今天是车间突然断网,生产线都停了!”

一大早接到电信协同排查的电话,语气里满是焦灼。要知道车间网络一旦中断,扫码入库、设备联网监控全得停摆,每耽误一分钟都是真金白银的损失。

挂了电话,我们立刻带齐工具赶去现场,路上还在复盘客户之前提到的一个细节:几个月来办公室经常会断网,但刷新几次又能恢复,本以为是小毛病没当回事,没想到今天车间直接“罢工”,而且怎么折腾都连不上。

第一重隐患:藏在IP里的“小错误”

到了现场先从“老问题”查起——既然偶尔断网且刷新能恢复,大概率是网络配置问题或者设备性能问题。

交换机是傻瓜交换机,那就没什么好看的了,但是网络接口的灯,怎么感觉那么怪呢?

不管了,先看路由器吧,刚登录WEB界面,一眼就看到了问题:子网掩码255.255.255.0。

不可能,绝对不可能,电信绝不会这么大方,直接给一整段公网IP?那不是天方夜谭么?

抬头看了一眼光猫,果然应该是255.255.255.252,迅速修改后,这个垃圾路由还不立即生效,还非得重启一下。

重启后,上网正常,暂时也没有出现需要刷新的故障现象,但是,由于时间还短,未必就不会再出现同样的故障现象了,也许还有其他问题,还没排查到。

但这个时候,更急的显然是车间的网络,那就继续排查,看看究竟是什么问题?

第二重奇葩:亮着灯的“坏零件”

到车间后,笔记本电脑接入交换机,顺利获取到IP,ping网关能通,ping外网却完全超时。

tracert -d 某网址。能解析出IP,也能走到外网去,看似正常,但是打开浏览器,无法上网。

怪,真怪,全是傻瓜交换机,既然有了IP,ping网关也能通,tracert 都出去了,凭什么不能上网?

跳过交换机,笔记本电脑直插光纤收发器,故障还是一样,但又不太一样:IP正常获取到,ping网关也能通,但是tracert出不去了。

观察光纤收发器,这个灯的闪烁频率,怎么看就怎么怪,那重启光纤收发器吧。

tracert出去了几跳,后面立即不行了,但是ping网关的窗口没关,除了重启的时候断了几个包,后面没掉过,一直是通的状态。

真是怪了,算了,不折腾了,换光纤收发器吧。

笔记本电脑瞬间恢复了网络,把交换机连上,车间的生产设备也陆续恢复了联网!原来问题真的出在光纤收发器上,没想到啊,这玩意儿居然“装死”都这么逼真。

复盘:两个故障给我们的警示

复盘这次的排查经历,两个故障点其实都藏着小教训:

固定IP配置别大意:很多人觉得填对IP就行,忽略了子网掩码、网关这些“配套设置,一定要和网络服务商确认准确的配置参数,避免因小错误导致间歇性断网。

别被硬件指示灯“骗了”:指示灯亮不代表设备完全正常,像这次的光纤收发器,可能是内部光电转换模块有故障,更换后,机房交换机的灯,看着也正常了。

最后想问大家:你们在工作中遇到过哪些“灯亮却故障”的奇葩设备问题?欢迎在评论区分享你的排查经历~ 觉得有用的话,别忘了点赞收藏,转发给身边搞IT运维的朋友!

关注《IT狂人日志》,下次分享更多网络排查的实用技巧!