工業(yè)交換機常見(jiàn)的故障類(lèi)型及分析排查方法
瀏覽次數:發(fā)布時(shí)間:2020-12-31
交換機運行中出現故障是不可避免的,但出現故障后應當迅速地進(jìn)行處理,盡快查出故障點(diǎn),排除故障,這是網(wǎng)管人員應盡的職責。但是要做到這一點(diǎn),就必須了解交換機故障的類(lèi)型及具備對故障進(jìn)行分析和處理的能力。為此,
飛暢科技就交換機常出現的故障類(lèi)型及分析排查的方法進(jìn)行簡(jiǎn)要的介紹,感興趣的朋友就一起來(lái)看看吧!
一、電源故障
由于外部供電不穩定,電源線(xiàn)路老化或者雷擊等原因導致電源損壞或者風(fēng)扇停轉,以致不能正常工作?;蛘哂捎陔娫淳壒蕦е聶C內其他部件的損壞都會(huì )使交換機出現問(wèn)題。
如果交換機面板上的POWER指示燈是綠色的,就表示是正常的;如果該指示燈滅了,則說(shuō)明交換機沒(méi)有正常供電。這類(lèi)問(wèn)題很容易發(fā)現,也很容易解決,同時(shí)也是最容易預防的。
針對這類(lèi)故障,首先應該做好外部電源的供應工作,一般通過(guò)引入獨立的電力線(xiàn)來(lái)提供獨立的電源,并添加穩壓器來(lái)避免瞬間高壓或低壓現象。如果條件允許,可以添加UPS(不間斷電源)來(lái)保證交換機的正常供電,有的UPS提供穩壓功能,而有的沒(méi)有,選擇時(shí)要注意。在機房?jì)仍O置專(zhuān)業(yè)的避雷措施,來(lái)避免雷電對交換機的傷害?,F在有很多做避雷工程的專(zhuān)業(yè)公司,實(shí)施網(wǎng)絡(luò )布線(xiàn)時(shí)可以考慮。
二、端口故障
這是最常見(jiàn)的硬件故障,無(wú)論是光纖端口還是雙絞線(xiàn)的RJ-45端口,在插拔接頭時(shí)一定要小心。如果不小心把光纖插頭弄臟,可能導致光纖端口污染而不能正常通信。我們經(jīng)??吹胶芏嗳讼矚g帶電插拔接頭,理論上講是可以的,但是這樣也無(wú)意中增加了端口的故障發(fā)生率。在搬運時(shí)不小心,也可能導致端口物理?yè)p壞。如果購買(mǎi)的水晶頭尺寸偏大,插入交換機時(shí),也容易破壞端口。此外,如果接在端口上的雙絞線(xiàn)有一段暴露在室外,萬(wàn)一這根電纜被雷電擊中,就會(huì )導致所連交換機端口被擊壞,或者造成更加不可預料的損傷。
一般情況下,端口故障是某一個(gè)或者幾個(gè)端口損壞。所以,在排除了端口所連計算機的故障后,可以通過(guò)更換所連端口,來(lái)判斷其是否損壞。遇到此類(lèi)故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果端口確實(shí)被損壞,那就只能更換端口了。
三、模塊故障
交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴展模塊等。這些模塊發(fā)生故障的幾率很小,不過(guò)一旦出現問(wèn)題,就會(huì )遭受巨大的經(jīng)濟損失。如果插拔模塊時(shí)不小心,或者搬運交換機時(shí)受到碰撞,或者電源不穩定等情況,都可能導致此類(lèi)故障的發(fā)生。
當然上面提到的這3個(gè)模塊都有外部接口,比較容易辨認,有的還可以通過(guò)模塊上的指示燈來(lái)辨別故障。比如:堆疊模塊上有一個(gè)扁平的梯形端口,或者有的交換機上是一個(gè)類(lèi)似于USB的接口。管理模塊上有一個(gè)C*OLE口,用于和網(wǎng)管計算機建立連接,方便管理。如果擴展模塊是光纖連接的話(huà),會(huì )有一對光纖接口。
在排除此類(lèi)故障時(shí),首先確保交換機及模塊的電源正常供應,然后檢查各個(gè)模塊是否插在正確的位置上,最后檢查連接模塊的線(xiàn)纜是否正常。在連接管理模塊時(shí),還要考慮它是否采用規定的連接速率,是否有奇偶校驗,是否有數據流控制等因素。連接擴展模塊時(shí),需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有一個(gè),那就是應當立即聯(lián)系供應商進(jìn)行更換。
四、背板故障
交換機的各個(gè)模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會(huì )造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導致機內溫度升高,致使元器件燒壞。
在外部電源正常供電的情況下,如果交換機的各個(gè)內部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況即使是電器維修工程師,恐怕也無(wú)計可施,惟一的辦法就是更換背板了。
五、線(xiàn)纜故障
其實(shí)這類(lèi)故障從理論上講,不屬于交換機本身的故障,但在實(shí)際使用中,電纜故障經(jīng)常導致交換機系統或端口不能正常工作,所以這里也把這類(lèi)故障歸入交換機硬件故障。比如接頭接插不緊,線(xiàn)纜制作時(shí)順序排列錯誤或者不規范,線(xiàn)纜連接時(shí)應該用交叉線(xiàn)卻使用了直連線(xiàn),光纜中的兩根光纖交錯連接,錯誤的線(xiàn)路連接導致網(wǎng)絡(luò )環(huán)路等。
從上面的幾種硬件故障來(lái)看,機房環(huán)境不佳極易導致各種硬件故障,所以我們在建設機房時(shí),必須先做好防雷接地及供電電源、室內溫度、室內濕度、防電磁干擾、防靜電等環(huán)境的建設,為網(wǎng)絡(luò )設備的正常工作提供良好的環(huán)境。
六、系統錯誤
交換機系統是硬件和軟件的結合體。在交換機內部有一個(gè)可刷新的只讀存儲器,它保存的是這臺交換機所必需的軟件系統。這類(lèi)錯誤也和我們常見(jiàn)的Windows、Linux一樣,由于當時(shí)設計的原因,存在一些漏洞,在條件合適時(shí),會(huì )導致交換機滿(mǎn)載、丟包、錯包等情況的發(fā)生。所以交換機系統提供了諸如Web、FTP等方式來(lái)下載并更新系統。當然在升級系統時(shí),也有可能發(fā)生錯誤。
對于此類(lèi)問(wèn)題,我們需要養成經(jīng)常瀏覽設備廠(chǎng)商網(wǎng)站的習慣,如果有新的系統推出或者新的補丁,請及時(shí)更新。
七、配置不當
初學(xué)者對交換機不熟悉,或者由于各種交換機配置不一樣,管理員往往在配置交換機時(shí)會(huì )出現配置錯誤。比如VLAN 劃分不正確導致網(wǎng)絡(luò )不通,端口被錯誤地關(guān)閉,交換機和網(wǎng)卡的模式配置不匹配等原因。這類(lèi)故障有時(shí)很難發(fā)現,需要一定的經(jīng)驗積累。如果不能確保用戶(hù)的配置有問(wèn)題,請先恢復出廠(chǎng)默認配置,然后再一步一步地配置。最好在配置之前,先閱讀說(shuō)明書(shū),這也是網(wǎng)管所要養成的習慣之一。每臺交換機都有詳細的安裝手冊、用戶(hù)手冊,深入到每類(lèi)模塊都有詳細的講解。由于很多交換機的手冊是用英文編寫(xiě)的,所以英文不好的用戶(hù)可以向供應商的工程師咨詢(xún)后再做具體配置。
八、外部因素
由于*或者黑客攻擊等情況的存在,有可能某臺主機向所連接的端口發(fā)送大量不符合封裝規則的數據包,造成交換機處理器過(guò)分繁忙,致使數據包來(lái)不及轉發(fā),進(jìn)而導致緩沖區溢出產(chǎn)生丟包現象。還有一種情況就是廣播風(fēng)暴,它不僅會(huì )占用大量的網(wǎng)絡(luò )帶寬,而且還將占用大量的CPU處理時(shí)間。網(wǎng)絡(luò )如果長(cháng)時(shí)間被大量廣播數據包所占用,正常的點(diǎn)對通信就無(wú)法正常進(jìn)行,網(wǎng)絡(luò )速度就會(huì )變慢或者癱瘓。
一塊網(wǎng)卡或者一個(gè)端口發(fā)生故障,都有可能引發(fā)廣播風(fēng)暴。由于交換機只能分割沖突域,而不能分割廣播域(在沒(méi)有劃分VLAN 的情況下),所以當廣播包的數量占到通信總量的30%時(shí),網(wǎng)絡(luò )的傳輸效率就會(huì )明顯下降。
總結:由于交換機故障現象多種多樣,沒(méi)有固定的排除步驟,而有的故障往往具有明確的方向性,一眼就能識別得出。所以只能根據具體情況具體分析了,當然不管是什么樣的故障對于一個(gè)新的網(wǎng)絡(luò )管理員來(lái)說(shuō)都是困難的事,所以如果你希望能夠成為交換機故障的排除高手,就一定要在日常工作中積累經(jīng)驗,每弄好一個(gè)問(wèn)題都用心的去回顧問(wèn)題根源以及解決方法。這樣才能更好地完成網(wǎng)絡(luò )管理的工作。