回覆列表
-
1 # 運維蟲子
-
2 # 笨驢技術
機房的網路故障的排查,首先要透過snmp管理軟體,檢測各個網路裝置是否執行正常。另外,還存在如下各種可能性:
內網ARP欺騙攻擊。
內網病毒攻擊。
交換機、路由器硬體故障。
網線接觸不良、網線老化。
廣播風暴、網路環路。
以上這些問題,即使是一個有經驗的網管,需要組合ping、arp、tracert等多條命令進行測試分析,才可以逐步排查出來。有時還需要用抓包工具來抓包分析。為了簡化網管人員的工作,我們的WFilter軟體(WSG閘道器)中,集成了一個實用性很強的外掛“網路健康度檢測”。以上問題一鍵就可以檢測出來。如下圖:
但是,軟體的檢測只是一個檢測和定位手段,故障的具體解決是需要人工去操作的。
機房網路環境和普通的網路環境是不一樣的
1.確認網路拓撲圖,要找到匯聚層,核心層的交換機,熟悉這些交換機的配置,二層不用關心,三層交換機的配置要重點關注下VLAN和路由。
2.利用開源或者收費的監控軟體,對交換機的各個埠的流量,丟包,錯誤包進行一個監控
以上倆點是預防和監控
如果發生故障:
1.對核心層的交換機IP以及上聯IP分別進行連續ping,哪個節點有丟包,就是哪個交換機出問題了。
2.找到出問題的交換機,在交換機上執行命令dis int brief,檢視交換機各個埠的資訊,如果是錯誤包多,那就是鏈路有問題,如果是頻寬佔用率高的話,就看下是哪個IP佔用頻寬高,對其進行限速即可。
最後,機房網路一般不會發生故障,一般故障就是頻寬跑滿和鏈路有問題,只有進行網路割接的時候,才會發生大故障(不過一般是有備用交換機,不會有問題)