三個方法教你(nǐ)排除交換機(jī)故障

添加時間:2016-04-13 15:42:33

來(lái)源:

浏覽:

由于交換機(jī)在公司網絡中應用範圍非常廣泛,從(cóng)低端到中端,從(cóng)中端到高端,幾乎涉及每個級别的産品,所以交換機(jī)發生(shēng)故障的機(jī)率比路(lù)由器,硬件(jiàn)防火(huǒ)牆等要高很多,這也是爲什麽我們首先討(tǎo)論交換機(jī)故障的分(fēn)類與排除故障步驟的原因。


 一、交換機(jī)故障分(fēn)類:

  交換機(jī)故障一般可(kě)以分(fēn)爲硬件(jiàn)故障和軟件(jiàn)故障兩大(dà)類。硬件(jiàn)故障主要指交換機(jī)電源、背闆、模塊、端口等部件(jiàn)的故障,可(kě)以分(fēn)爲以下幾類。

  (1)電源故障:

  由于外部供電不穩定,或者電源線路(lù)老化或者雷擊等原因導緻電源損壞或者風(fēng)扇停止,從(cóng)而不能正常工(gōng)作(zuò)。由于電源緣故而導緻機(jī)内其他(tā)部件(jiàn)損壞的事(shì)情也經常發生(shēng)。

  如(rú)果面闆上的POWER指示燈是綠色的,就(jiù)表示是正常的;如(rú)果該指示燈滅了,則說(shuō)明交換機(jī)沒有正常供電。這類問(wèn)題很容易發現,也很容易解決,同時也是最容易預防的。

  針對這類故障,首先應該做好外部電源的供應工(gōng)作(zuò),一般通過引入獨立的電力線來(lái)提供獨立的電源,并添加穩壓器來(lái)避免瞬間高壓或低壓現象。如(rú)果條件(jiàn)允許,可(kě)以添加UPS(不間斷電源)來(lái)保證交換機(jī)的正常供電,有的UPS提供穩壓功能,而有的沒有,選擇時要注意。在機(jī)房(fáng)内設置專業的避雷措施,來(lái)避免雷電對交換機(jī)的傷害。現在有很多做避雷工(gōng)程的專業公司,實施網絡布線時可(kě)以考慮。

  (2)端口故障:

  這是最常見(jiàn)的硬件(jiàn)故障,無論是光(guāng)纖端口還(hái)是雙絞線的RJ-45端口,在插拔接頭時一定要小心。如(rú)果不小心把光(guāng)纖插頭弄髒,可(kě)能導緻光(guāng)纖端口污染而不能正常通信。我們經常看(kàn)到很多人(rén)喜歡帶電插拔接頭,理(lǐ)論上講是可(kě)以的,但(dàn)是這樣也無意中增加了端口的故障發生(shēng)率。在搬運時不小心,也可(kě)能導緻端口物理(lǐ)損壞。如(rú)果購(gòu)買的水晶頭尺寸偏大(dà),插入交換機(jī)時,也容易破壞端口。此外,如(rú)果接在端口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就(jiù)會導緻所連交換機(jī)端口被擊壞,或者造成更加不可(kě)預料的損傷。

  一般情況下,端口故障是某一個或者幾個端口損壞。所以,在排除了端口所連計(jì)算機(jī)的故障後,可(kě)以通過更換所連端口,來(lái)判斷其是否損壞。遇到此類故障,可(kě)以在電源關閉後,用酒精棉球清洗端口。如(rú)果端口确實被損壞,那就(jiù)隻能更換端口了。

  (3)模塊故障:

  交換機(jī)是由很多模塊組成,比如(rú):堆疊模塊、管理(lǐ)模塊(也叫控制模塊)、擴展模塊等。這些模塊發生(shēng)故障的機(jī)率很小,不過一旦出現問(wèn)題,就(jiù)會遭受巨大(dà)的經濟損失。如(rú)果插拔模塊時不小心,或者搬運交換機(jī)時受到碰撞,或者電源不穩定等情況,都(dōu)可(kě)能導緻此類故障的發生(shēng)。

  當然上面提到的這3個模塊都(dōu)有外部接口,比較容易辨認,有的還(hái)可(kě)以通過模塊上的指示燈來(lái)辨别故障。比如(rú):堆疊模塊上有一個扁平的梯形端口,或者有的交換機(jī)上是一個類似于USB的接口。管理(lǐ)模塊上有一個CONSOLE口,用于和網管計(jì)算機(jī)建立連接,方便管理(lǐ)。如(rú)果擴展模塊是光(guāng)纖連接的話(huà),會有一對光(guāng)纖接口。

  在排除此類故障時,首先确保交換機(jī)及模塊的電源正常供應,然後檢查各個模塊是否插在正确的位置上,最後檢查連接模塊的線纜是否正常。在連接管理(lǐ)模塊時,還(hái)要考慮它是否采用規定的連接速率,是否有奇偶校(xiào)驗,是否有數據流控制等因素。連接擴展模塊時,需要檢查是否匹配通信模式,比如(rú):使用全雙工(gōng)模式還(hái)是半雙工(gōng)模式。當然如(rú)果确認模塊有故障,解決的方法隻有一個,那就(jiù)是應當立即聯系供應商給以更換。

  (4)背闆故障:

  交換機(jī)的各個模塊都(dōu)是接插在背闆上的。如(rú)果環境潮濕,電路(lù)闆受潮短(duǎn)路(lù),或者元器件(jiàn)因高溫、雷擊等因素而受損都(dōu)會造成電路(lù)闆不能正常工(gōng)作(zuò)。比如(rú):散熱(rè)性能不好或環境溫度太高導緻機(jī)内溫度升高,指使元器件(jiàn)燒壞。

  在外部電源正常供電的情況下,如(rú)果交換機(jī)的各個内部模塊都(dōu)不能正常工(gōng)作(zuò),那就(jiù)可(kě)能是背闆壞了,遇到這種情況即使是電器維修工(gōng)程師(shī),恐怕也無計(jì)可(kě)施,惟一的辦法就(jiù)是更換背闆了。

  (5)線纜故障:

  其實這類故障從(cóng)理(lǐ)論上講,不屬于交換機(jī)本身(shēn)的故障,但(dàn)在實際使用中,電纜故障經常導緻交換機(jī)系統或端口不能正常工(gōng)作(zuò),所以這裡(lǐ)也把這類故障歸入交換機(jī)硬件(jiàn)故障。比如(rú)接頭接插不緊,線纜制作(zuò)時順序排列錯誤或者不規範,線纜連接時應該用交叉線卻使用了直連線,光(guāng)纜中的兩根光(guāng)纖交錯連接,錯誤的線路(lù)連接導緻網絡環路(lù)等。

從(cóng)上面的幾種硬件(jiàn)故障來(lái)看(kàn),機(jī)房(fáng)環境不佳極易導緻各種硬件(jiàn)故障,所以我們在建設機(jī)房(fáng)時,必須先做好防雷接地及供電電源、室内溫度、室内濕度、防電磁幹擾、防靜(jìng)電等環境的建設,爲網絡設備的正常工(gōng)作(zuò)提供良好的環境。

  二、交換機(jī)的軟件(jiàn)故障:

  交換機(jī)的軟件(jiàn)故障是指系統及其配置上的故障,它可(kě)以分(fēn)爲以下幾類。

  (1)系統錯誤:

  交換機(jī)系統是硬件(jiàn)和軟件(jiàn)的結合體(tǐ)。在交換機(jī)内部有一個可(kě)刷新的隻讀(dú)存儲器,它保存的是這台交換機(jī)所必需的軟件(jiàn)系統。這類錯誤也和我們常見(jiàn)的Windows、Linux一樣,由于當時設計(jì)的原因,存在一些漏洞,在條件(jiàn)合适時,會導緻交換機(jī)滿載、丢包、錯包等情況的發生(shēng)。所以交換機(jī)系統提供了諸如(rú)Web、TFTP等方式來(lái)下載并更新系統。當然在升級系統時,也有可(kě)能發生(shēng)錯誤。

  對于此類問(wèn)題,我們需要養成經常浏覽設備廠(chǎng)商網站(zhàn)的習慣,如(rú)果有新的系統推出或者新的補丁,請(qǐng)及時更新。

  (2)配置不當:

  初學者對交換機(jī)不熟悉,或者由于各種交換機(jī)配置不一樣,管理(lǐ)員(yuán)往往在配置交換機(jī)時會出現配置錯誤。比如(rú)VLAN 劃分(fēn)不正确導緻網絡不通,端口被錯誤地關閉,交換機(jī)和網卡的模式配置不匹配等原因。這類故障有時很難發現,需要一定的經驗積累。如(rú)果不能确保用戶的配置有問(wèn)題,請(qǐng)先恢複出廠(chǎng)默認配置,然後再一步一步地配置。最好在配置之前,先閱讀(dú)說(shuō)明書(shū),這也是網管所要養成的習慣之一。每台交換機(jī)都(dōu)有詳細的安裝手冊、用戶手冊,深入到每類模塊都(dōu)有詳細的講解。由于很多交換機(jī)的手冊是用英文編寫的,所以英文不好的用戶可(kě)以向供應商的工(gōng)程師(shī)咨詢後再做具體(tǐ)配置。

  (3)密碼丢失:

  這可(kě)能是每個管理(lǐ)員(yuán)都(dōu)曾經經曆過的。一旦忘記密碼,都(dōu)可(kě)以通過一定的操作(zuò)步驟來(lái)恢複或者重置系統密碼。有的則比較簡單,在交換機(jī)上按下一個按鈕就(jiù)可(kě)以了。而有的則需要通過一定的操作(zuò)步驟才能解決。

  此類情況一般在人(rén)爲遺忘或者交換機(jī)發生(shēng)故障後導緻數據丢失,才會發生(shēng)。

  (4)外部因素:

  由于病毒或者黑(hēi)客攻擊等情況的存在,有可(kě)能某台主機(jī)向所連接的端口發送大(dà)量不符合封裝規則的數據包,造成交換機(jī)處理(lǐ)器過分(fēn)繁忙,緻使數據包來(lái)不及轉發,進而導緻緩沖區溢出産生(shēng)丢包現象。還(hái)有一種情況就(jiù)是廣播風(fēng)暴,它不僅會占用大(dà)量的網絡帶寬,而且還(hái)将占用大(dà)量的CPU處理(lǐ)時間。網絡如(rú)果長時間被大(dà)量廣播數據包所占用,正常的點對通信就(jiù)無法正常進行,網絡速度就(jiù)會變慢(màn)或者癱瘓。

  一塊網卡或者一個端口發生(shēng)故障,都(dōu)有可(kě)能引發廣播風(fēng)暴。由于交換機(jī)隻能分(fēn)割沖突域,而不能分(fēn)割廣播域(在沒有劃分(fēn)VLAN 的情況下),所以當廣播包的數量占到通信總量的30%時,網絡的傳輸效率就(jiù)會明顯下降。

  總的來(lái)說(shuō)軟件(jiàn)故障應該比硬件(jiàn)故障較難查找,解決問(wèn)題時,可(kě)能不需要花費過多的金錢,而需要較多的時間。最好在平時的工(gōng)作(zuò)中養成記錄日(rì)志的習慣。每當發生(shēng)故障時,及時做好故障現象記錄、故障分(fēn)析過程、故障解決方案、故障歸類總結等工(gōng)作(zuò),以積累自(zì)己的經驗。比如(rú)有時在進行配置時,由于種種原因,當時沒有對網絡産生(shēng)影(yǐng)響或者沒有發現問(wèn)題,但(dàn)也許幾天以後問(wèn)題就(jiù)會逐漸顯現出來(lái)。如(rú)果有日(rì)志記錄,就(jiù)可(kě)以聯想到是否前幾天的配置有錯誤。由于很多時候都(dōu)會忽略這一點,以爲是在其他(tā)方面出現問(wèn)題,當走了許多彎路(lù)之後,才找到問(wèn)題所在。所以說(shuō)記錄日(rì)志及維護信息是非常必要的。

  三、交換機(jī)故障的一般排障步驟:

  交換機(jī)的故障多種多樣,不同的故障有不同的表現形式。故障分(fēn)析時要通過各種現象靈活運用排除方法(如(rú)排除發、對比法、替換法),找出故障所在,并及時排除。

  (1)排除法:

  當我們面對故障現象并分(fēn)析問(wèn)題時,無意中就(jiù)已經學會使用排除法來(lái)确定發生(shēng)故障的方向了。這種方法是指依據所觀察到的故障現象,盡可(kě)能全面地列舉出所有可(kě)能發生(shēng)的故障,然後逐個分(fēn)析、排除。在排除時要遵循有簡到繁的原則,提高效率。使用這種方法可(kě)以應付各種各樣的故障,但(dàn)維護人(rén)員(yuán)需要有較強的邏輯思維,對交換機(jī)知識有全面深入的了解。

  (2)對比法:

  所謂對比法,就(jiù)是利用現有的、相(xiàng)同型号的且能夠正常運行的交換機(jī)作(zuò)爲參考對象,和故障交換機(jī)之間進行對比,從(cóng)而找出故障點。這種方法簡單有效,尤其是系統配置上的故障,隻要簡單地對比一下就(jiù)能找出配置的不同點,但(dàn)是有時要找一台型号相(xiàng)同、配置相(xiàng)同的交換機(jī)也不是一件(jiàn)容易的事(shì)。

  (3)替換法:

  這是我們最常用的方法,也是在維修電腦中使用頻率較高的方法。替換法是指使用正常的交換機(jī)部件(jiàn)來(lái)替換可(kě)能有故障的部件(jiàn),從(cóng)而找出故障點的方法。它主要用于硬件(jiàn)故障的診斷,但(dàn)需要注意的是,替換的部件(jiàn)必須是相(xiàng)同品牌、相(xiàng)同型号的同類交換機(jī)才行。

  四、分(fēn)析交換機(jī)故障的原則

  當然爲了使排障工(gōng)作(zuò)有章(zhāng)可(kě)循,我們可(kě)以在故障分(fēn)析時,按照(zhào)以下的原則來(lái)分(fēn)析。

  1.由遠(yuǎn)到近

  端口模塊—>水平線纜—>跳(tiào)線—>交換機(jī)這樣一條路(lù)線,逐個檢查,先排除遠(yuǎn)端故障的可(kě)能。

  2.由外而内

  如(rú)果交換機(jī)存在故障,我們可(kě)以先從(cóng)外部的各種指示燈上辨别,然後根據故障指示,再來(lái)檢查内部的相(xiàng)應部件(jiàn)是否存在問(wèn)題。比如(rú)POWER LED爲綠燈表示電源供應正常,熄滅表示沒有電源供應;LINK LEDs爲黃(huáng)色表示現在該連接工(gōng)作(zuò)在10Mb/s,綠色表示爲100 Mb/s,熄滅表示沒有連接,閃爍表示端口被管理(lǐ)員(yuán)手動關閉;RDP LED表示冗餘電源;MGMT LED表示管理(lǐ)員(yuán)模塊。無論能否從(cóng)外面的出故障所在,都(dōu)必須登錄交換機(jī)以确定具體(tǐ)的故障所在,并進行相(xiàng)應的排障措施。

  3.由軟到硬

  發生(shēng)故障,誰都(dōu)不想動不動就(jiù)那螺絲刀去(qù)先拆了交換機(jī)再說(shuō),所以在檢查時,總是先從(cóng)系統配置或系統軟件(jiàn)上着手進行排查。如(rú)果軟件(jiàn)上不能解決問(wèn)題,那就(jiù)是硬件(jiàn)有問(wèn)題了。比如(rú)某端口不好用,那我們可(kě)以先檢查用戶所連接的端口是否不在相(xiàng)應的VLAN中,或者該端口是否被其他(tā)的管理(lǐ)員(yuán)關閉,或者配置上的其他(tā)原因。如(rú)果排除了系統和配置上的各種可(kě)能,那就(jiù)可(kě)以懷疑到真正的問(wèn)題所在——硬件(jiàn)故障上。

  4.先易後難

  在遇到故障分(fēn)析較複雜時,必須先從(cóng)簡單操作(zuò)或配置來(lái)着手排除。這樣可(kě)以加快(kuài)故障排除的速度,提高效率。

 


 
QQ在線咨詢
客服微信号
客戶咨詢熱(rè)線
0519-88100999