关于某港口集团
某港口是国家重要的战略资源,是京津冀及“三北”地区的海上门户、雄安新区主要出海口,是“一带一路 ”的海陆交汇点 、新亚欧大陆桥经济走廊的重要节点和服务全面对外开放的国际枢纽港 ,连续多年跻身世界港口前十强。
疫情通行卡系统故障现象
近期凌晨时段,该港口货运司机通过手机上传核酸报告时,总是会出现大量的等待时间,或者上传失败的现象。
港口疫情通行卡系统,为港口车辆司机提供通行安全保障,该故障导致车辆司机无法正常通行,严重影响了港口货物运输效率。
IT运维人员与系统开发部门经过分析,初步认为,在故障期间,上传疫情通行卡的接口(该接口是IP/backPgd/esb/uploading/xxxqidemic)出现了问题,可能由于网络中某个设备或系统阻断引起。
本案例对该故障进行分析验证。
流量采集和分析
利用Netinside全流量回溯系统,进行数据采集和故障分析。
流量采集架构图
NetInside系统对三个区域流量进行全面监控,分别为:一体化区域、核心交换域、华为云平台区域(上图三个红色箭头所指的区域),港口疫情通行卡为这三个区域内的系统,这样能全面做到对疫情通行卡系统流量的监测与分析。
分析过程
针对故障接口进行排查,通过NetInside系统对凌晨故障时间段的流量进行抓包分析,验证上传接口在故障时是否的确存在异常。
疫情通行卡通过Nginx代理,接入2台Web服务器。分析系统通过对2台服务器的数据采集和分析统计。
分析得到,服务器1图片上传55次,且每次都成功。如下图。
服务器2图片上传46次,且每次都成功。
通过分析看到,在故障时段,并没有发现对应的接口出现异常。
结语
通过上述监测分析,发现故障原因并非跟之前猜测结果相同,说明该故障另有缘由,可能需要进一步深入分析。