IT貓撲網(wǎng):您身邊最放心的安全下載站! 最新更新|軟件分類|軟件專題|手機(jī)版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當(dāng)前所在位置:首頁系統(tǒng)集成網(wǎng)絡(luò)故障 → 采取措施 理順故障診斷脈絡(luò)

采取措施 理順故障診斷脈絡(luò)

時間:2015/6/28來源:IT貓撲網(wǎng)作者:網(wǎng)管聯(lián)盟我要評論(0)

    能不能期望我們每一位網(wǎng)管員都能夠解決網(wǎng)絡(luò)運(yùn)行中出現(xiàn)的所有問題呢?通過多年網(wǎng)絡(luò)管理的總結(jié)認(rèn)為,如果預(yù)先采取一定的措施,并且使用正確的故障診斷方法,那么回答是肯定的。下面給出了一個較為完整的過程,敬請各位同行批評指正。

    及時更新網(wǎng)絡(luò)圖

    首先應(yīng)該繪制一個網(wǎng)絡(luò)方框圖。這個文檔的作用是為從事故障診斷的人員提供一個關(guān)于網(wǎng)絡(luò)布局和配置的全部信息的單一來源。網(wǎng)絡(luò)圖上包含的主要內(nèi)容有:

    ●路由器的連接圖;
    ●設(shè)備的序號、型號及端口情況;
    ●使用的路由協(xié)議(如RIP、OSPF等);
    ●IOS版本(用于具有何種性能查找和判別);
    ●已安裝的模塊;
    ●訪問控制列表;
    ●地址(網(wǎng)絡(luò)地址和序號,MAC地址更好);
    ●交換機(jī)(型號);
    ●集線器(Hub型號);
    ●所有配置的拷貝。

    當(dāng)網(wǎng)絡(luò)使用發(fā)生變化時,要及時更新網(wǎng)絡(luò)圖。如果沒有更新網(wǎng)絡(luò)圖,那么您的網(wǎng)絡(luò)圖的用處就要大打折扣,這將是非常危險的。如果出現(xiàn)這種情況,您必須馬上繪制一幅新的網(wǎng)絡(luò)圖,而不是依賴那個不能反映實(shí)際情況的老的網(wǎng)絡(luò)圖。

    當(dāng)網(wǎng)絡(luò)以通常方式運(yùn)行時,必須符合網(wǎng)絡(luò)性能的基線;用來記錄網(wǎng)絡(luò)在低、中和高使用量時的信息量。它建立了一個網(wǎng)絡(luò)運(yùn)行性能的記錄,該記錄可以用來進(jìn)行比較,以確定是否出現(xiàn)問題。網(wǎng)絡(luò)運(yùn)行性能基線中包含以下主要內(nèi)容:

    ●網(wǎng)絡(luò)上運(yùn)行了哪些協(xié)議;
    ●每個協(xié)議使用的帶寬百分比;
    ●每個協(xié)議的峰值使用量和平均使用量;
    ●數(shù)據(jù)包的大小以及每種大小數(shù)據(jù)包的百分比;
    ●循環(huán)冗余校驗(Cyclical Redundancy Check,CRC)發(fā)現(xiàn)的錯誤的峰值和平均值;
    ●網(wǎng)段每秒鐘傳輸?shù)男畔姆逯岛推骄担?br />    ●是否存在超長的數(shù)據(jù)包;
    ●沖突域每秒產(chǎn)生的沖突的峰值和平均值;
    ●網(wǎng)段運(yùn)行的峰值和平均值。

    故障診斷方法與步驟

    正確地確定問題是解決問題的關(guān)鍵。下面我們按照順序介紹故障診斷方法、步驟。應(yīng)該注意的是這些步驟往往是相互重疊的,而且解決問題的方法實(shí)質(zhì)上是循環(huán)式的。

    ⑴確定網(wǎng)絡(luò)問題的性質(zhì);

    ⑵收集有關(guān)的情況并對問題進(jìn)行分析;

    ⑶分析問題產(chǎn)生的原因;

    ⑷設(shè)計一個解決問題計劃;

    ⑸實(shí)現(xiàn)這個解決問題計劃;

    ⑹評估該解決問題計劃產(chǎn)生的結(jié)果;

    ⑺重復(fù)上面的操作,直到問題得到解決;

    ⑻將解決方案記入文檔資料。

    確定網(wǎng)絡(luò)問題的性質(zhì)實(shí)際上就是要提出問題。即"誰出了問題,是什么問題,何時產(chǎn)生和出現(xiàn)在何處"這樣的形式。這些問題可能會多次出現(xiàn),您可以向用戶、網(wǎng)管員、以及遇到或者了解問題的其他人詳細(xì)提問:誰受到了問題的影響?是單個用戶還是存在共性的一組用戶,甚至是整個網(wǎng)絡(luò)中的所有用戶呢? 

若是單個用戶可能出現(xiàn)下列若干問題中之一:

    ●物理層問題,包括發(fā)生故障的網(wǎng)絡(luò)電纜?捎肞ing來測試;
    ●在特定主機(jī)上的硬件故障。用Ping 127.0.0.1或Ping本機(jī)地址來檢測;
    ●軟件加載不正確或者崩潰了,尤其是網(wǎng)絡(luò)協(xié)議出了問題?芍匮b軟件或刪除網(wǎng)絡(luò)協(xié)議后重新加載網(wǎng)絡(luò)協(xié)議;
    ●主機(jī)地址或者子網(wǎng)掩碼設(shè)置不正確?尚拚鳈C(jī)地址和子網(wǎng)掩碼;
    ●默認(rèn)網(wǎng)關(guān)配置不正確。可用Tracert檢測,重新修正默認(rèn)網(wǎng)關(guān)。

    擁有公共屬性或者遇到問題的一組用戶可能出現(xiàn)下列若干問題:

    ●網(wǎng)絡(luò)設(shè)備(比如集線器或者交換機(jī))發(fā)生了故障;
    ●路由器接口發(fā)生故障;
    ●服務(wù)器發(fā)生故障;
    ●訪問列表設(shè)置錯誤;
    ●VLAN配置錯誤。

    在我們知道"誰出了問題"后,就要集中精力解決:這個問題有何表現(xiàn)?是沒有連接還是只有部分連接的問題,或者是根本沒有連接的問題呢?如果是沒有連接的問題,那它就屬于:

    ●硬件故障;
    ●遠(yuǎn)程通信服務(wù)故障;
    ●路由協(xié)議故障。

    如果是部分連接的問題,那它屬于;

    ●訪問列表問題;
    ●子網(wǎng)掩碼不正確;
    ●路由協(xié)議不兼容。

    這個問題何時發(fā)生呢?是間歇性出現(xiàn)還是經(jīng)常發(fā)生的問題,或者是剛剛發(fā)生的問題呢?

    如是間歇性發(fā)生的問題,其原因可能是:

    ●遠(yuǎn)程通信服務(wù)故障;
    ●信息擁擠;
    ●路由循環(huán)。

    如是經(jīng)常發(fā)生的問題,那么原因是信息擁擠。出現(xiàn)新問題的原因是:

    ●訪問列表發(fā)生變化;
    ●新的硬件故障;
    ●路由協(xié)議發(fā)生變化;
    ●新增加的路由。

    正確確定網(wǎng)絡(luò)問題的性質(zhì),是我們判斷是廣域線路問題還是局域網(wǎng)中的問題的基礎(chǔ)。

    解決故障步驟

    收集有關(guān)的情況并對問題進(jìn)行分析

    主要包括對設(shè)備進(jìn)行觀察,設(shè)法了解問題究竟存在什么位置?梢酝ㄟ^查看路由器的接口和進(jìn)程命令,查看內(nèi)存、緩存和CPU的使用情況等等。在查看過程中,應(yīng)記錄發(fā)現(xiàn)的情況,以便評估存在問題的原因。如遇到間歇性失去連接的問題,注意查看該接口復(fù)位了多少次。如果問題與訪問列表相關(guān),就需要查看訪問列表是如何設(shè)置的,與現(xiàn)有文檔的注釋進(jìn)行比較,判斷是否一致。如現(xiàn)有的設(shè)置與文檔不一致,應(yīng)審查更新文檔的策略。在盡可能收集到各種情況后,即可轉(zhuǎn)入對問題原因的分析工作。

    分析產(chǎn)生問題的原因

    就是要確定這個問題本身有什么表現(xiàn),誰受到了這個問題的影響。如果我們不知道這個情況,就需要倒退一個或兩個步驟,重新思考這個問題。如果收集到正確的信息,那么在解決問題模型中,這是最容易執(zhí)行的步驟之一。知道誰受到了問題的影響,這個問題有何表現(xiàn),問題在何時發(fā)生,以及問題發(fā)生在何處。剩下的唯一問題就是這個問題為何會發(fā)生。當(dāng)我們對OSI模型有一個透徹的了解時,解決這個問題對故障診斷者來說就變得易如反掌了。因此要求我們對OSI模型的每一層協(xié)議功能要非常熟悉,才能從中獲得重要的線索,以確定問題為何會發(fā)生。

    當(dāng)您認(rèn)為問題的原因已經(jīng)找到后,應(yīng)該再花一點(diǎn)時間來確定其他還有什么原因?qū)е聠栴}的產(chǎn)生。您應(yīng)該避免只找出單個原因。只有找到確定的原因越多,您解決問題的可能性就越大。因此要盡量找出可能的故障原因,按降序列出導(dǎo)致故障的可能原因,并從中找出最有可能的故障原因。

 設(shè)計解決問題計劃

    只有當(dāng)確定了導(dǎo)致問題產(chǎn)生的最有可能的原因時,才能制定一個操作計劃。包括為了解決問題而計劃使用的操作步驟。在確定操作步驟時。應(yīng)盡量做到詳細(xì);這個計劃越詳細(xì),按照這個計劃執(zhí)行的可能性就越大。一旦制定好計劃,就要按步驟實(shí)施這個計劃。

    實(shí)施解決問題計劃

    當(dāng)在實(shí)施操作計劃時,以特別注意,每次只能作一個修改。如果修改后問題解決,那么應(yīng)該將修改的結(jié)果進(jìn)行分析并記入文檔。如果修改沒有成功,應(yīng)該立即撤消這個修改。重要的是要按照制定的計劃來進(jìn)行操作。因為在實(shí)施計劃中,有時由于某一步不行,很容易嘗試新的方法。這樣做的危害是很快就失去對原計劃的跟蹤線索,結(jié)果往往使情況變得更加槽糕。一旦發(fā)現(xiàn)原計劃不可行,正確的方法是應(yīng)該重新設(shè)計計劃,然后實(shí)施新的計劃。

    另外,在實(shí)施操作計劃時,應(yīng)特別注意安全程序的執(zhí)行。安全性是我們最擔(dān)心的事情。不要或者盡量少開放網(wǎng)絡(luò),在解決問題時,也應(yīng)該盡可能縮短放松安全性的時間。前者可以阻止不太精明黑客突破網(wǎng)絡(luò)的企圖,后者可以減少黑客在在網(wǎng)絡(luò)安全性放松時攻擊網(wǎng)絡(luò)的可能性。

    評估操作計劃產(chǎn)生的結(jié)果

    觀察結(jié)果最簡單的方法是用第一步中獲得的數(shù)據(jù)來測試。問題的表現(xiàn)或者某些表現(xiàn)是否仍然存在呢?如在第一步中簡明說明了存在的問題,那么就可以較容易地測定問題地表現(xiàn)是否存在。如果問題的某些表現(xiàn)已經(jīng)解決,但其他的表現(xiàn)仍然存在,那么將解決方案記入文檔,然后轉(zhuǎn)入下一個操作步驟。

    間歇性問題的測試并不是那么容易進(jìn)行。有時要等到發(fā)生另一個故障時才能進(jìn)行測試。在這種情況時,在最終確定問題之前,必須把對系統(tǒng)的修改記入文檔,這是非常重要的。

    重復(fù)操作過程

    在完美無缺的環(huán)境中,根本

關(guān)鍵詞標(biāo)簽:診斷,故障,措施,采取,

相關(guān)閱讀

文章評論
發(fā)表評論

熱門文章 提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決IS-IS同時下發(fā)缺省路由出現(xiàn)路由環(huán)路問題的解IS-IS同時下發(fā)缺省路由出現(xiàn)路由環(huán)路問題的解IBGP鄰居無法建立連接問題的解決方法IBGP鄰居無法建立連接問題的解決方法對稱結(jié)構(gòu)承載網(wǎng)流量出現(xiàn)異常問題的故障解決對稱結(jié)構(gòu)承載網(wǎng)流量出現(xiàn)異常問題的故障解決

相關(guān)下載

人氣排行 光纖上網(wǎng) 路由器設(shè)置頁面進(jìn)不去怎么辦登錄SSH服務(wù)器失敗問題的分析及解決無線網(wǎng)卡連接不上怎么辦_無線網(wǎng)卡連接不上解決方法提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決方法本機(jī)IP設(shè)置不當(dāng)造成路由異常故障分析路由設(shè)置不當(dāng) 導(dǎo)致VPN無法訪問外網(wǎng)無線路由器無不能上網(wǎng)的秘密ADSL頻繁掉線如何解決?