服務(wù)器常見故障的診斷與解決
A:網(wǎng)絡(luò)管理員90%的工作往往是診斷和解決各種各樣的故障。雖然說沒有人喜歡麻煩,但麻煩總是自己找上門來。只有擁有高超的診斷技能,你才能在緊急情況下迅速響應(yīng),保障網(wǎng)絡(luò)流暢地運(yùn)行。當(dāng)你面臨網(wǎng)絡(luò)故障的挑戰(zhàn)時(shí),首先向自己問幾個(gè)簡單的問題:有哪些地方被改變了?這個(gè)問題以前遇到過嗎?如果是,是什么時(shí)候?是否有可能讓問題再次出現(xiàn)?用戶做了什么特別的*作嗎?其他用戶有沒有遇到過同樣的問題?
接下來嘗試隔離問題,每次排除一部 分可能引起該問題的因素,逐步找出問題的真正根源。例如,如果一個(gè)工作站不能連接到服務(wù)器,那就先確定是網(wǎng)絡(luò)問題還是工作站本身的問題。如果能夠迅速地肯定問題出在工作站本身,你就排除了一大半可能導(dǎo)致問題的因素,向真正的故障根源接近一大步了。即使你最終拿不出解決辦法,不得不尋找外援,隔離問題也會(huì)節(jié)省你大量的時(shí)間。
為了說明診斷網(wǎng)絡(luò)故障的一般過程,本文例舉了幾種故障情形,有的是常見的小問題,有的是比較艱巨的挑戰(zhàn)。當(dāng)你遇到類似的問題時(shí),就可以按照本文例子的介紹,先問自己幾個(gè)簡單的問題,逐步隔離問題所在,最后找到真正的問題根源。
一、找不到驗(yàn)證密碼的域服務(wù)器
毫無疑問,你也一定遇到過這樣的情形:當(dāng)你坐在一臺(tái)工作站之前準(zhǔn)備登錄網(wǎng)絡(luò),Windows卻報(bào)告說找不到用來驗(yàn)證密碼的域服務(wù)器。要解決這個(gè)故障,首先要確定問題到底出在網(wǎng)絡(luò)、工作站還是服務(wù)器上。從下面幾個(gè)問題開始:
-哪些地方改變了?最近是否改動(dòng)過網(wǎng)絡(luò),而這些改動(dòng)可能導(dǎo)致當(dāng)前的問題?有沒有添加新的服務(wù)器、拆除原有的服務(wù)器、改動(dòng)過交換機(jī)或HUB?有沒有添加或減少域控制器、將成員服務(wù)器提升為DC(域控制器)或者相反?
-其他工作站也存在類似的問題嗎?
-服務(wù)器正在運(yùn)行嗎?
經(jīng)過檢查,你發(fā)現(xiàn)此前工作站一直順利地運(yùn)行,其他工作站沒有遇到類似的問題,服務(wù)器也正常。根據(jù)故障現(xiàn)象,基本上可以確定故障出在工作站本身。接下來要確定工作站的那個(gè)地方出了故障,試試下面幾個(gè)問題:
-工作站能夠Ping到服務(wù)器嗎?
-工作站獲得了一個(gè)IP地址嗎?
檢測表明,工作站能夠Ping到服務(wù)器,但Ping*作有時(shí)超時(shí),這表明工作站和服務(wù)器之間只有斷斷續(xù)續(xù)的通信。在命令行上執(zhí)行ipconfig /renew命令,多執(zhí)行幾次,工作站有時(shí)會(huì)更新IP地址,有時(shí)不會(huì)。這是工作站和服務(wù)器之間斷續(xù)通信的癥狀。
現(xiàn)在將問題工作站的網(wǎng)絡(luò)連接和另一臺(tái)工作站的對(duì)換一下,新工作站在問題工作站的位置上也不能連接網(wǎng)絡(luò),而問題工作站卻能從另一個(gè)網(wǎng)絡(luò)位置順利地連接網(wǎng)絡(luò)?,F(xiàn)在已經(jīng)很清楚:問題工作站所在位置的電纜或Hub出了問題。
拆下故障位置上網(wǎng)絡(luò)電纜連接Hub的那一端,將它接到另一個(gè)Hub上,故障依舊。現(xiàn)在可以肯定電纜就是引起故障的罪魁禍?zhǔn)琢恕?/font>
二、Windows服務(wù)不能啟動(dòng)
在一臺(tái)Windows 2000服務(wù)器上,部分服務(wù)設(shè)置成不用本地的系統(tǒng)帳戶啟動(dòng)。一次重新啟動(dòng)Windows 2000服務(wù)器之后,發(fā)現(xiàn)這些服務(wù)沒有啟動(dòng),必須手工打開服務(wù),重新輸入密碼,然后啟動(dòng)服務(wù)。每次重新輸入密碼,都收到消息說:〈用戶名字〉已被授予作為服務(wù)登錄的權(quán)限。
要解決該故障,首先回答下面幾個(gè)問題:
-哪些地方改變了?是否有人修改了服務(wù)器?
-這個(gè)服務(wù)以前能夠啟動(dòng)嗎?
-用戶名稱和密碼正確嗎?
查詢修改記錄發(fā)現(xiàn),該服務(wù)器是一個(gè)DC,不久之前還是域控制器組織單元(OU,Organizational Unit)的成員。在移出該OU之前,這些服務(wù)一直能夠順利啟動(dòng)。另外,用來啟動(dòng)這些服務(wù)的用戶名稱和密碼都是合法的。進(jìn)一步研究發(fā)現(xiàn),域控制器OU的成員有一些特殊的權(quán)限,其中包括作為服務(wù)登錄的權(quán)限。當(dāng)出現(xiàn)問題的服務(wù)器移出該OU時(shí),服務(wù)器失去了那些權(quán)限?,F(xiàn)在要做的是恢復(fù)服務(wù)器的權(quán)限。
要將權(quán)限授予服務(wù)器,請(qǐng)按照如下步驟*作:
-在管理控制臺(tái)(MMC)中打開活動(dòng)目錄用戶和計(jì)算機(jī)管理單元,再打開域控制器OU的“屬性”對(duì)話框。
-在組策略頁中,點(diǎn)擊“默認(rèn)域控制器策略”,然后點(diǎn)擊“編輯”,打開組策略管理器。
-依次擴(kuò)展計(jì)算機(jī)配置/Windows設(shè)置/安全設(shè)置,再擴(kuò)展“本地策略”,然后點(diǎn)擊“用戶權(quán)利指派”。
-在右邊的窗格中,右擊“作為服務(wù)登錄”,選擇菜單“安全”。
-把用來啟動(dòng)服務(wù)的用戶帳戶加入到策略,完成后點(diǎn)擊“確定”。
有關(guān)該問題的更多資料,請(qǐng)參見微軟的文章“如何解決服務(wù)啟動(dòng)權(quán)限問題”(http://support.microsoft.com/?kbid=259733)。
三、無法收到外面發(fā)來的郵件
單位用Exchange 2000 Server作為內(nèi)部和外部的郵件服務(wù)器。有一天原來的ISP不能再提供服務(wù)了,所以你迅速換了一個(gè)新的ISP。用戶仍舊能夠照常訪問Internet,卻收不到外面來的郵件。不過,發(fā)出去的郵件看來沒有問題。
要排解這一故障,第一個(gè)要問的問題是:
-在改變ISP之前,郵件系統(tǒng)工作正常嗎?
要確定Exchange Server是否正常工作,防火墻配置是否正確,可以從Internet連接到Exchange Server 25端口(具體*作辦法,請(qǐng)參見微軟文章:Telnet 到 IMC 的端口 25 以測試 IMC 通信, http://support.microsoft.com/?kbid=153119),發(fā)送一個(gè)測試消息,確認(rèn)服務(wù)器和防火墻都在正常運(yùn)行。故障的原因很可能是因?yàn)楦淖?/font>ISP。
再回答下面這個(gè)問題:
-域名信息正確轉(zhuǎn)移到了新的ISP嗎?
用Nslookup工具,測試一下是否能夠找到域的郵件交換(MX)記錄,結(jié)果卻什么也沒有找到。根據(jù)這一現(xiàn)象,可以推斷在更換ISP時(shí),域名注冊(cè)公司沒有正確轉(zhuǎn)移域名信息?,F(xiàn)在你可以聯(lián)系域名注冊(cè)公司,要求登記MX記錄,以及將域名信息正確轉(zhuǎn)到新的ISP。只要MX記錄在Internet上一傳播開,Exchange Server又可以收到外面來的郵件了。
四、網(wǎng)絡(luò)上看不到服務(wù)器
Win2K Pro工作站遇到了奇怪的問題:偶爾能夠看到Win 2K Server,但大部分時(shí)間里服務(wù)器就象從網(wǎng)絡(luò)上消失了一樣。在排解這一網(wǎng)絡(luò)故障的過程中,首先要回答的問題是:
-過去出現(xiàn)過該故障嗎?
-是否所有的工作站都出現(xiàn)相同的情況?
經(jīng)調(diào)查后發(fā)現(xiàn),這一故障現(xiàn)象自服務(wù)器從 Windows NT 4.0升級(jí)到Win2K就開始存在了,網(wǎng)絡(luò)上的所有工作站都出現(xiàn)同樣的現(xiàn)象?,F(xiàn)在要確定的是:故障的根源是服務(wù)器呢,還是網(wǎng)絡(luò)。
登錄一個(gè)工作站,打開命令控制臺(tái),執(zhí)行ping/pathping命令來連接服務(wù)器。結(jié)果發(fā)現(xiàn),Ping服務(wù)器的IP地址沒有問題,但卻Ping不到服務(wù)器的名字。可以肯定,故障的原因是名稱解析或DNS錯(cuò)誤。
接下來執(zhí)行ipconfig/all,注意到工作站上DNS服務(wù)器指向了ISP的DNS服務(wù)器。Win2K將DNS作為其基本的名稱解析機(jī)制,但現(xiàn)在工作站卻用ISP的DNS服務(wù)器來解析本地網(wǎng)絡(luò)的Win2K服務(wù)器名稱。當(dāng)工作站向ISP的DNS服務(wù)器查詢Win2K服務(wù)器名稱時(shí),只能得到超時(shí)錯(cuò)誤,導(dǎo)致Win2K服務(wù)器從網(wǎng)絡(luò)上隱身了。要解決該故障,必須把主DNS服務(wù)器指向內(nèi)部的Win2K DNS服務(wù)器,讓內(nèi)網(wǎng)的工作站向Win2K DNS服務(wù)器查詢本地服務(wù)器名稱。
首先證實(shí)Win2K服務(wù)器上確實(shí)已經(jīng)安裝了DNS服務(wù),且DNS服務(wù)在正常運(yùn)行,然后修改Win2K DNS服務(wù)器IP地址指向它自己。接下來利用DNS管理器,驗(yàn)證DNS服務(wù)器位于根位置,且已經(jīng)啟用轉(zhuǎn)發(fā)。啟用轉(zhuǎn)發(fā)之后,就可以解析非本地的任何IP地址了。不要忘記將ISP的DNS服務(wù)器輸入轉(zhuǎn)發(fā)欄。最后配置一下服務(wù)器上的DHCP,將DNS服務(wù)器從ISP的改成Win2K服務(wù)器,刷新工作站上的IP地址?,F(xiàn)在網(wǎng)絡(luò)已經(jīng)能夠穩(wěn)定地運(yùn)行了。有關(guān)在這類環(huán)境下配置DNS的信息,請(qǐng)參見微軟的文章“HOW TO:配置 DNS 以訪問 Internet”(http://support.microsoft.com/?kbid=300202)。
五、LAN連接到多個(gè)WAN
不久前在A市安裝了一個(gè)LAN,它有兩個(gè)WAN連接,其中一個(gè)連接通向私有的幀中繼網(wǎng)絡(luò),另一個(gè)連接通向Internet,這是為了防止出現(xiàn)故障和提高性能(圖二顯示了網(wǎng)絡(luò)結(jié)構(gòu))。現(xiàn)在出現(xiàn)的故障是:A市的用戶有時(shí)不能順利訪問B市的服務(wù)器。
要解決該故障,首先要搞清楚下面兩個(gè)問題:
-故障何時(shí)出現(xiàn)?
-默認(rèn)網(wǎng)關(guān)是什么?
故障出現(xiàn)是間歇性的。在A市的DHCP配置中,默認(rèn)網(wǎng)關(guān)是192.168.1.11(即防火墻)。由于A市LAN里面的所有機(jī)器都會(huì)出現(xiàn)同樣的故障現(xiàn)象,所以問題很可能出在A市網(wǎng)絡(luò)上的全局性路由配置上。
在防火墻上有一條靜態(tài)路由,從192.168.2.0(掩碼255.255.255.0)到192.168.1.10,用Route Print可以驗(yàn)證這一規(guī)則。A市服務(wù)器有時(shí)可以Ping到B市的服務(wù)器,但有時(shí)不能。運(yùn)行Tracert,結(jié)果如圖三所示,它顯示出了數(shù)據(jù)包應(yīng)當(dāng)通過的路徑。但有的時(shí)候,運(yùn)行Tracert卻顯示出數(shù)據(jù)包在第一個(gè)躍點(diǎn)(192.168.1.11)之后遇到超時(shí)錯(cuò)誤。根據(jù)這一現(xiàn)象,可以推測防火墻沒有可靠地將數(shù)據(jù)包轉(zhuǎn)發(fā)到控制192.168.2.0通信的Cisco路由器。
查閱防火墻的日志,可以看到數(shù)據(jù)包有時(shí)被禁止轉(zhuǎn)發(fā)到192.168.1.10,雖然存在這樣一條轉(zhuǎn)發(fā)規(guī)則也無濟(jì)于事。防火墻的種類很多,但大多數(shù)防火墻廠商都反對(duì)將防火墻當(dāng)作路由器,如果防火墻被攻擊者劫持,有關(guān)WAN連接的大量信息就會(huì)泄露。
因此現(xiàn)在要重新配置網(wǎng)絡(luò),使用默認(rèn)的網(wǎng)關(guān)192.168.1.10(即路由器),執(zhí)行命令Ip route 0.0.0.0 0.0.0.0 192.168.1.11在路由器上建立一個(gè)默認(rèn)的路由。用戶訪問Internet時(shí)先通過路由器,再穿越防火墻。
如果A市的路由器(192.168.1.10)出現(xiàn)故障,會(huì)對(duì)Internet訪問產(chǎn)生哪些影響?如果幀中繼網(wǎng)絡(luò)失效,但Internet連接仍正常,情況又如何?一旦A市的路由器故障,Internet連接也會(huì)丟失,這是因?yàn)槟J(rèn)的網(wǎng)關(guān)指向了該路由器,該路由器故障導(dǎo)致數(shù)據(jù)包不能轉(zhuǎn)發(fā)到防火墻。在A市,將DHCP默認(rèn)網(wǎng)關(guān)配置成防火墻可以恢復(fù)Internet連接,當(dāng)然,在恢復(fù)A市路由器之前,其他地區(qū)的私有WAN和Internet訪問仍舊無效。
六、工作站不能連接網(wǎng)絡(luò)
辦公大樓五樓的工作站看不到服務(wù)器,也不能訪問Internet。故障間歇性出現(xiàn)。首先要搞清楚的問題是:
-故障出現(xiàn)多長時(shí)間了?
-有哪些地方被改變了?
經(jīng)Pathping工具測試,檢測到一些數(shù)據(jù)包丟失錯(cuò)誤。問題看來可以歸結(jié)到五樓之內(nèi)。
利用信號(hào)發(fā)生器或線纜掃描器追蹤故障,跟蹤網(wǎng)絡(luò)連接一直到了六樓的Ethernet交換機(jī),五樓和六樓共用該交換機(jī)??紤]到可能是交換機(jī)端口故障,所以將端口和六樓的一臺(tái)機(jī)器對(duì)換了一下,但故障仍舊存在,而且仍只出現(xiàn)在五樓的工作站上,由此推斷,交換機(jī)應(yīng)該沒有問題。
返回五樓,注意到一個(gè)辦公室里有個(gè)五口的小Hub。進(jìn)一步查看,注意到還有四個(gè)小Hub菊形相連。現(xiàn)在故障的根源找到了。在100 Base-T Ethernet中,每個(gè)網(wǎng)絡(luò)只能有一個(gè)Class I轉(zhuǎn)發(fā)躍距(0.7毫秒延遲),或者兩個(gè)Class II轉(zhuǎn)發(fā)躍距(0.4毫秒延遲)(由于這個(gè)原因,所以不推薦在重要場合使用大量小Hub)?,F(xiàn)在拆除所有小Hub,將線頭直接接到六樓的交換機(jī),故障消失。
總地來說,不能認(rèn)為靠死記硬背就能夠解決所有常見的網(wǎng)絡(luò)問題,相反地,應(yīng)當(dāng)以開放的心態(tài)審視每一種故障現(xiàn)象,從幾個(gè)簡單的問題開始,逐步排除可能的故障原因。記住,隔離問題是迅速排解故障的關(guān)鍵所在。
七、附錄:常用網(wǎng)絡(luò)診斷工具
Windows XP和Windows 2000提供了許多基本的網(wǎng)絡(luò)檢測工具:
■ Pathping
Pathping用來檢驗(yàn)是否能夠聯(lián)系到指定的主機(jī)。命令行語法是:pathping 。pathping將顯示出數(shù)據(jù)包丟失情況的基本信息。
■ Ipconfig
Ipconfig命令用來顯示出工作站的IP配置。命令行語法是:ipconfig /all。通過ipconfig命令的運(yùn)行結(jié)果,至少可以:
-驗(yàn)證工作站具有正確的IP地址和子網(wǎng)掩碼。錯(cuò)誤的IP地址和子網(wǎng)掩碼會(huì)導(dǎo)致連接出錯(cuò)。 -如果啟用了DHCP,則可以驗(yàn)證工作站已經(jīng)租到了一個(gè)IP地址。如果不能獲得IP地址,則表明與DHCP服務(wù)器聯(lián)系方面出了問題。
-驗(yàn)證默認(rèn)的網(wǎng)關(guān)。如果網(wǎng)關(guān)錯(cuò)誤,連接遠(yuǎn)程網(wǎng)絡(luò)或Internet時(shí)就會(huì)出現(xiàn)問題。
-驗(yàn)證DNS服務(wù)器。XP和Win 2K依靠DNS進(jìn)行名稱解析。一般地,工作站應(yīng)當(dāng)指向一臺(tái)Win 2K服務(wù)器以獲得DNS解析。
■ Nslookup
Nslookup即名稱服務(wù)器查找(Name Server Lookup),用來查找DNS服務(wù)器上的DNS記錄。命令語法:nslookup。在前文的例子中,我們用NSLookup來驗(yàn)證郵件交換(MX)記錄,排解Internet郵件傳送問題。
■ Route Print
Route Print命令顯示出本地機(jī)器上的路由規(guī)則。這個(gè)工具和Ping、Tracert以及Pathping命令結(jié)合很有用,能夠幫助確定數(shù)據(jù)包通過的路由器。命令語法是:route print。另外,利用Route Add可以將靜態(tài)路由規(guī)則加入到服務(wù)器或工作站。
聯(lián)系客服