必須澄清,雖然文章是我總結(jié)整理的,但是很多知識(shí)的確不是我能研究分析得出來,通過聽培訓(xùn)、看書、實(shí)踐所總結(jié)得出,一方面為了給自己備用,以便以后出現(xiàn)問題能解決,另一方面也希望遇到相同問題的朋友能從中得到一些啟示。所以文章里面的知識(shí)可能會(huì)在很多地方都出現(xiàn)。
我們經(jīng)常會(huì)遇到很多連接問題,同時(shí)程序員往往也認(rèn)為連接數(shù)據(jù)庫只需要簡(jiǎn)單地連接→openconnection→操作→close,但是一個(gè)簡(jiǎn)單的連接動(dòng)作,背后往往帶有很多東西,充分理解,會(huì)對(duì)開發(fā)及管理有很大的幫助,畢竟連不上服務(wù)器其他一切都是白搭:
原因一:數(shù)據(jù)庫連接是很“重”的操作,消耗資源很多
在常見的C/S模式中,簡(jiǎn)單的連接操作背后潛藏如下操作:
1、客戶端與遠(yuǎn)程服務(wù)器的監(jiān)聽程序(listenerprogram)建立聯(lián)系。
2、監(jiān)聽程序要么創(chuàng)建一個(gè)進(jìn)程或線程來執(zhí)行數(shù)據(jù)庫核心程序,要么直接或間接地把客戶請(qǐng)求傳遞給已存在的服務(wù)器進(jìn)程,取決于服務(wù)器是否共享服務(wù)器。
3、為每個(gè)session建立新環(huán)境,跟蹤它們的行為。建立前還要做賬號(hào)密碼匹配。有可能DBMS還要執(zhí)行登錄觸發(fā)器,初始化存儲(chǔ)過程和程序包(如果它們是第一次被調(diào)用的話)。
4、客戶端進(jìn)程和服務(wù)器進(jìn)程之間要完成的握手協(xié)議。
正因?yàn)槿绱耍B接池技術(shù)才尤為重要。
原因二:程序(包括存儲(chǔ)過程)和數(shù)據(jù)庫之間的交互也要開銷:
即使連接建立但未中斷,程序和DBMS之間的上下文切換也有代價(jià)。對(duì)此,如果DBMS支持?jǐn)?shù)據(jù)通過數(shù)組傳遞,應(yīng)該毫不猶豫使用它。
一些初級(jí)程序員(沒有鄙視的意思),會(huì)很簡(jiǎn)單地在每個(gè)插入中連接、斷開數(shù)據(jù)庫,如果有大量數(shù)據(jù)(過萬已經(jīng)會(huì)出現(xiàn)問題),就容易耗盡服務(wù)器資源。曾經(jīng)聽過一名微軟工程師說他們?nèi)シ?wù)客戶的一個(gè)例子,一個(gè)手機(jī)流水線,但是開到第五條線的時(shí)候就卡得不行,實(shí)在開不了第六條線。后來發(fā)現(xiàn),是編程的時(shí)候把循環(huán)放在連接的外層,每循環(huán)一次,就要連接、斷開一次。造成嚴(yán)重的負(fù)載。后來把循環(huán)放到連接里面,可以開到上百條生產(chǎn)線??梢娺B接的重要性。
數(shù)據(jù)庫客戶端應(yīng)用使用數(shù)據(jù)庫服務(wù)時(shí):
第一步、在SQL Server上建立一個(gè)連接。如果雙方都在一臺(tái)機(jī)器上,就是本地連接。如果不在一臺(tái)機(jī)器上,就需要通過網(wǎng)絡(luò)層。
第二步、客戶端需要告知SQL Server自己的身份。然后SQLServer需要認(rèn)證(Authentication)是否合法,從而賦予預(yù)設(shè)的授權(quán)(Authorization)
以上的工作有客戶端數(shù)據(jù)驅(qū)動(dòng)程序(ODBC、OLE DB、NativeClient、JDBC等)和SQL Server交互完成,成功以后客戶端用戶才能開始訪問數(shù)據(jù)。
在連接過程中,如果遇到問題,客戶端驅(qū)動(dòng)程序一定會(huì)拋出錯(cuò)誤信息。讓我們找到錯(cuò)誤的原因:
1、 客戶端驅(qū)動(dòng)沒能找到用戶指定的SQL Server:如
SQL Server doesn’t exist or access denied
雖然說是不存在或者訪問被拒絕,但是其實(shí)意味著:指定的SQL Server沒找到
2、 SQL Server已經(jīng)找到,甚至連接已經(jīng)建立,但是因?yàn)槟撤N未知原因,連接異常中斷:
[DBMSSOCN] General network error. Chack your networkdocumentation.
或者
A transport level error occurred when sending a request(provider:TCP provider error: 0 an existing connection was forcibly closed bythe remote host)
這種錯(cuò)誤可能發(fā)生在連接過程中的任何時(shí)候,包括建立初期和客戶端指令運(yùn)行時(shí),原因有很多,比較難簡(jiǎn)單處理。
3、 用戶認(rèn)證失敗,SQLServer認(rèn)為連接使用了一個(gè)非法用戶而拒絕:
Login failed for user “Null”
“消息 18456,級(jí)別 14,狀態(tài) 1,服務(wù)器 <computer_name>,第1行”
“用戶‘<user_name>’ 登錄失敗”
4、 認(rèn)證過程中遇到錯(cuò)誤,認(rèn)證動(dòng)作異常終止
Failed to generate SSPI context
這種錯(cuò)誤發(fā)生在一些原有權(quán)力訪問的SQLServer用戶身上。用戶明明有訪問權(quán)力。但是在某些機(jī)器上,某些時(shí)段無法連接。
有時(shí)候錯(cuò)誤會(huì)間歇發(fā)生甚至?xí)詣?dòng)消失。
下面來詳細(xì)說明一下:
一、協(xié)議的選擇與別名:
連接數(shù)據(jù)庫首先要啟用網(wǎng)絡(luò)協(xié)議,無論是本地連接還是網(wǎng)絡(luò)連接。
SQL Server可以同時(shí)偵聽多種協(xié)議處理請(qǐng)求??蛻舳耍ㄟ@里的客戶端是多種的,不是特指前端應(yīng)用程序)會(huì)選擇一個(gè)協(xié)議連接SQLServer。如果不知道SQLServer正在偵聽哪個(gè)協(xié)議,可以配置客戶端按順序嘗試連接:
SQLServer目前常用的有3個(gè):Shared Memory、TCP/IP和Named Pipe
Shared Memory:最簡(jiǎn)單的協(xié)議,沒有特殊配置
由于該協(xié)議僅能連到同一臺(tái)計(jì)算機(jī)上運(yùn)行的SQLServer。索引對(duì)應(yīng)大多數(shù)連接是沒有辦法使用的。但可以在調(diào)試其他協(xié)議的時(shí)候進(jìn)行故障界定工作,以確保連接問題是和網(wǎng)絡(luò)層有關(guān),還是和SQLServer自己有關(guān)系。同時(shí),它也是最快的協(xié)議。
TCP/IP:在Internet上廣泛使用的通用協(xié)議
包括路由網(wǎng)絡(luò)流量的標(biāo)準(zhǔn),并提供高級(jí)安全功能,是商業(yè)中最常用的協(xié)議。也是SQLServer最常用的網(wǎng)絡(luò)協(xié)議。
Named Pipe:是為局域網(wǎng)開發(fā)的協(xié)議
內(nèi)存的一部分被某個(gè)進(jìn)程用來向另一個(gè)進(jìn)程傳遞信息,因此一個(gè)進(jìn)程的輸出就是另一個(gè)進(jìn)程的輸入。第二個(gè)進(jìn)程可以是本地的(與第一進(jìn)程處于同一臺(tái)計(jì)算機(jī)上),也可以是遠(yuǎn)程的(位于聯(lián)網(wǎng)的計(jì)算機(jī)上)。如果你使用過命名管道進(jìn)行編程,會(huì)發(fā)現(xiàn)它是利用標(biāo)準(zhǔn)的Win32文件系統(tǒng)API函數(shù)(如ReadFile和WriteFile)來進(jìn)行數(shù)據(jù)的收發(fā)。與系統(tǒng)基層網(wǎng)絡(luò)傳送協(xié)議無關(guān)?;具^程如下:
(1)、SQLServer服務(wù)器使用CreateNamedPipe函數(shù)創(chuàng)建命名管道并對(duì)其進(jìn)行監(jiān)聽。
(2)、客戶端使用CreateFile和WriteFile函數(shù)試圖連接到服務(wù)器的命名管道。
所以:
1、 命名管道不是一個(gè)基層網(wǎng)絡(luò)協(xié)議。即使使用命名管道,也要配置TCP或其他基層網(wǎng)絡(luò)協(xié)議保證客戶端和SQLServer服務(wù)器之間的網(wǎng)絡(luò)連通性。
2、 命名管道是一個(gè)要通過系統(tǒng)認(rèn)證的協(xié)議。
因?yàn)樗紫仍L問服務(wù)器的IPC$共享。這一步必須通過Windows認(rèn)證。才能連到SQLServer監(jiān)聽的管道上。這是使用命名管道的最大好處,直接利用Windows內(nèi)置的安全機(jī)制。
應(yīng)該根據(jù)不同要求選擇協(xié)議,如果沒有特殊原因,建議先考慮TCP/IP協(xié)議。
連接決定使用哪種協(xié)議?
首先、由服務(wù)器的網(wǎng)絡(luò)協(xié)議配置控制。如果沒啟用,那么就沒辦法使用。
其次、客戶端也能設(shè)置協(xié)議順序。
最后、客戶端可以設(shè)置某個(gè)SQLServer服務(wù)的別名,指定其連接方式,同時(shí)客戶端也可對(duì)上次成功連接的緩存中使用連接方式。
1.1、 服務(wù)器網(wǎng)絡(luò)配置:
網(wǎng)絡(luò)配置在SQL Server配置管理器(Configuration Manager)的Network Configuration
配置的結(jié)果其實(shí)是存放在注冊(cè)表:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MicrosoftSQL Server\MSSQL.X\MSSQLServer\SuperSocketNetLib下的各個(gè)項(xiàng)目里??梢詮倪@里直接修改(但不建議)。修改需要重啟服務(wù)。
重啟后,檢查SQLServer的errorlog進(jìn)行確認(rèn)。
Shared Memory 正常啟動(dòng)后信息類似如下:
Xxxx-xx-xx xx:xx:xx.xx Server Server local connectionprovider is ready to accept connection on [\\.\pipe\SQLLocal\MSSQLSERVER].
Named Pipe正常啟動(dòng)后可以看到:
Xxxx-xx-xx xx:xx:xx.xx Server Server named pipe provider isready to accept connection on [\\.\pipe\sql\query].
TCP/IP正常啟動(dòng)可以看到:
xxxx-xx-xx xx:xx:xx.xx Server Server is listening on [‘a(chǎn)ny’<ipv4> 1433].—偵聽服務(wù)器上所有IP地址上的1433端口
1.2、 SQL Server Browser的作用:
如果客戶端使用TCP/IP協(xié)議連到SQLServer,就必須指定SQLServer正在偵聽的端口。如果使用NamedPipe,就必須指定管道名字。在2000之前,一臺(tái)計(jì)算機(jī)只能裝一個(gè)實(shí)例。所以SQLServer總之偵聽1433端口,當(dāng)2000引入多實(shí)例是,只有默認(rèn)實(shí)例可以使用這個(gè)端口。對(duì)于命名實(shí)例,每次重啟綁定的端口可能不一樣,而用戶只知道數(shù)據(jù)庫服務(wù)器名字和實(shí)例名,為此,SQLServer產(chǎn)品組開發(fā)了一套SQL Server解析協(xié)議(SSRP),用于偵聽UDP1434端口。該偵聽器服務(wù)由一個(gè)SQLServer實(shí)例兼任。任何一個(gè)客戶端要訪問這臺(tái)服務(wù)器上的SQL Server實(shí)例時(shí),都會(huì)先詢問UDP1434端口,然后由SSRP協(xié)議告訴客戶端本臺(tái)服務(wù)器上所安裝的SQLServer實(shí)例的端口號(hào)和管道名字。
但在2003年出現(xiàn)的Slammer病毒導(dǎo)致了這個(gè)組件發(fā)出大量的網(wǎng)絡(luò)包,是SQLServer相關(guān)的迄今為止危害最大的病毒。所以從SQLServer2005引入了SQL Server Browser服務(wù)替代原有機(jī)制。
SQL Server Browser使用SSRP偵聽UDP端口,并接受未經(jīng)身份驗(yàn)證的請(qǐng)求。為了減少惡意攻擊,SQLServer瀏覽器將設(shè)置在低級(jí)特權(quán)用戶的安全上下文中運(yùn)行。讓被攻擊的幾率降到最低。可以將新建用戶加入SQLServerXXXSQLBrowser$這個(gè)本地組。權(quán)限如下:
l 拒絕通過網(wǎng)絡(luò)訪問該計(jì)算機(jī)
l 拒絕本地登錄
l 拒絕以批處理作業(yè)登錄
l 拒絕通過“終端服務(wù)”登錄
l 作為服務(wù)登錄
l 讀寫與網(wǎng)絡(luò)通信(端口和管道)相關(guān)的SQL Server注冊(cè)表項(xiàng)。
SQL ServerBrowser啟動(dòng)后,它會(huì)啟動(dòng)并使用UDP 1434端口。此時(shí)會(huì)讀取注冊(cè)表,識(shí)別計(jì)算機(jī)上所有SQLServer實(shí)例,并注明使用的端口和命名管道。當(dāng)有多個(gè)網(wǎng)卡時(shí),會(huì)啟用第一個(gè)遇到的端口。
如果SQL Server Browser服務(wù)不運(yùn)行,而你提供了正確的端口號(hào)或命名管道,仍然可以連接SQLServer如果默認(rèn)實(shí)例在1433端口上運(yùn)行,可以使用TCP/IP連接到默認(rèn)實(shí)例。但是以下連接無效:
l 未完全指定所有參數(shù)(例如端口和管道名稱)的情況下,組件嘗試連接到命名實(shí)例。
l 生成或傳遞其他組件隨后要用來進(jìn)行重新連接的服務(wù)器/實(shí)例信息的組件。
l 未提供端口號(hào)或管道就連接到命名實(shí)例。
l 在未使用TCP 1433端口的情況下,將DAC連接到命名實(shí)例或默認(rèn)實(shí)例。
l 枚舉SSMS、企業(yè)管理器或查詢分析器中的服務(wù)器。
如果應(yīng)用程序通過網(wǎng)絡(luò)訪問SQLServer,要停止或禁用SQL Server Browser,必須為每個(gè)實(shí)例分配一個(gè)騰定端口號(hào),然后在應(yīng)用程序代碼中指定該端口號(hào)。但還有以下問題:
l 必須更新和維護(hù)客戶端應(yīng)用程序代碼。
l 如果服務(wù)器上的其他服務(wù)或應(yīng)用程序占用了端口,會(huì)導(dǎo)致實(shí)例不可用。
如果報(bào)告:SQL Server doesn’texist or access denied,可以嘗試指定端口,或管道名字,看能否連上,如果連上,是因?yàn)閁DP 1434在網(wǎng)絡(luò)中禁用了。需要防火墻或網(wǎng)關(guān)打開端口。要注意SQL Server Browser啟動(dòng)賬號(hào)要有讀寫與網(wǎng)絡(luò)通信相關(guān)的SQL Server注冊(cè)表項(xiàng)的權(quán)限。如果權(quán)限不夠,不會(huì)報(bào)錯(cuò),也不會(huì)返回錯(cuò)誤信息。
1.3、 客戶端網(wǎng)絡(luò)配置:
應(yīng)用程序都是通過加載SQL Server的數(shù)據(jù)驅(qū)動(dòng)控件做SQL Server連接。目前有三種:
a. MDAC(Microsoft數(shù)據(jù)訪問組件):
包括ODBC和OLE DB借口。主要是非.NET的應(yīng)用服務(wù)。默認(rèn)自帶,但有可能需要更新版本。在命令行中運(yùn)行:cliconfg.exe就可以配置MDAC訪問組件的網(wǎng)絡(luò)協(xié)議。
可以配置協(xié)議及先后順序,還可以餓配置是否使用SSL(網(wǎng)絡(luò)傳輸加密),是否嘗試使用Shared Memory等。同樣可以通過修改注冊(cè)表得到效果。
b. SQL Server Native Client:
是2005以后引入的用于OLE DB和ODBC的獨(dú)立數(shù)據(jù)訪問API。05自帶9.0版本,08自帶10版本。它將SQL Server OLE DB訪問接口和SQL Server ODBC驅(qū)動(dòng)程序組合成一個(gè)本機(jī)的DLL。除原有功能外,還提供新功能。用于創(chuàng)建新應(yīng)用程序或增強(qiáng)現(xiàn)有應(yīng)用程序,使其能在SQLServer2005中引入新功能。如MARS、UDT、查詢通知、快照隔離和XML數(shù)據(jù)類型支持。
如果使用C#等語言,且要使用05、08中新功能那么應(yīng)當(dāng)使用SQL Server的.NET Framework數(shù)據(jù)訪問接口,是VS2005的.NET Framework一部分。為2005、2008提供最強(qiáng)大的數(shù)據(jù)訪問組件。對(duì)于新功能,應(yīng)該選擇使用SQL Server Native Client。它和MDAC都支持使用行版本控制的已提交讀事務(wù)隔離,但使用它支持快照事務(wù)隔離。
這個(gè)組件默認(rèn)是不安裝的。可以在安裝時(shí)一起安裝,也可以在安裝文件的sqlncli.msi中單獨(dú)安裝。如果安裝了,可以在SQL Server Configuration Manager中看到和配置。
c. Microsoft JDBC Provider:是JAVA專用的。有專門的網(wǎng)絡(luò)配置界面。
1.4、 客戶端網(wǎng)絡(luò)連接選擇機(jī)制:
(1) SQL Server自己有網(wǎng)絡(luò)協(xié)議配置選項(xiàng),決定SQL Server偵聽哪些協(xié)議。如果沒開啟,則連接請(qǐng)求不會(huì)有反應(yīng)。
(2) 如果有多個(gè)實(shí)例,每個(gè)端口和管道名稱都不一樣。SQLServer Browser通過讀取注冊(cè)表信息,能夠知道本服務(wù)器上所有實(shí)例的網(wǎng)絡(luò)配置信息。當(dāng)客戶端連接時(shí),會(huì)先通過UDP1434向SQL Server Browser通信。這種機(jī)制是網(wǎng)絡(luò)配置可以向客戶端透明。
(3) 客戶端的數(shù)據(jù)庫連接組件上可以配置候選的網(wǎng)絡(luò)協(xié)議,及候選優(yōu)先級(jí)。
當(dāng)有多個(gè)協(xié)議時(shí),使用順序如下:
1. 在連接字符串(Connection String)中指定
a. Server關(guān)鍵字:Server=[protocol:]Server[,port]
如指定命名管道:np:Myserver\MyInstance
b. Network關(guān)鍵字:Network=dbmssocn
兩種方法只能選其一。
2. 客戶端別名:
如果指定了別名,就會(huì)去TPC/IP找別名這臺(tái)服務(wù)器,不成功就直接報(bào)錯(cuò),不會(huì)嘗試其他網(wǎng)絡(luò)協(xié)議。
3. 尋找相應(yīng)數(shù)據(jù)驅(qū)動(dòng)程序的”LastConnect”注冊(cè)表記錄:
在注冊(cè)表中會(huì)維護(hù)一組LastConnect記錄,記錄上次連接的網(wǎng)絡(luò)配置。如果1、2步不成功,將會(huì)使用這里的配置。如果本次不成功,數(shù)據(jù)驅(qū)動(dòng)程序會(huì)改試方法4
4. 按照數(shù)據(jù)庫驅(qū)動(dòng)程序的網(wǎng)絡(luò)配置優(yōu)先級(jí)選擇網(wǎng)絡(luò)協(xié)議,詢問SQL Server Browser動(dòng)態(tài)得知端口號(hào)或管道名字。當(dāng)所有配置都不成功時(shí),連接才報(bào)告失敗。
二、連接失敗檢測(cè)步驟——命名管道
Windows中,進(jìn)程間通信機(jī)制有郵槽、管道和套接字等。就管道而言,有命名管道和匿名管道。命名管道通過進(jìn)程間通信(IPC)機(jī)制實(shí)現(xiàn)通信。進(jìn)行單向或雙向數(shù)據(jù)通信。
SQL Server命名管道工作原理:
首先在服務(wù)器上創(chuàng)建一個(gè)命名管道并監(jiān)聽,然后客戶端連接這個(gè)管道進(jìn)行對(duì)話。
1. 命名管道的名稱:
才有UNC格式標(biāo)識(shí)命名管道:\\server\Pipe\path_name
\\server部分:指定命名管道所在的服務(wù)器,多用.來代表正在運(yùn)行的本地服務(wù)器。
\pipe: 是一個(gè)固定的“硬編碼”字串,表明管道協(xié)議。
\path_name:管道名稱,可以是多級(jí)目錄。一般監(jiān)聽的有:\sql\query。
例子:
默認(rèn)實(shí)例:\\.\pipe\sql\query
命名實(shí)例:\\.\pipe\MSSQL$instancename\sql\query
2. 配置或查看SQL Server監(jiān)聽的命名管道:
使用SQL Server Configuration Manager為每個(gè)實(shí)例配置格子的網(wǎng)絡(luò)協(xié)議:
3. 驗(yàn)證SQL Server是否監(jiān)聽了命名管道:
需要檢查errorlog:
客戶端的命名管道配置:
一般不會(huì)特殊配置,默認(rèn)開啟,但建議檢查
1. 客戶端網(wǎng)絡(luò)實(shí)用工具——MDAC數(shù)據(jù)庫接口:
Cliconfg.exe,如圖,必須保證SQLServer監(jiān)聽的命名管道名稱和客戶端連接的默認(rèn)管道名稱是一致的。
2. SQL Server ConfigurationManager——SQL Server Native Client:使用下圖配置
3. 善用客戶端SQL Server別名:
別名是在客戶端配置,不能在服務(wù)器設(shè)置一次就可以的??梢允褂肧QL Server Configuration Manager或者SQLServer客戶端網(wǎng)絡(luò)實(shí)用工具來管理:
命名管道連接問題的解決步驟:
1、 使用【服務(wù)器端網(wǎng)絡(luò)實(shí)用工具】檢查命名管道配置并確認(rèn)SQL Server已經(jīng)監(jiān)聽了命名管道協(xié)議。
2、 使用【客戶端網(wǎng)絡(luò)實(shí)用工具】檢查客戶端的連接協(xié)議配置,確保啟用了命名管道??蛻舳撕头?wù)器的默認(rèn)管道名稱需要和服務(wù)器監(jiān)聽的一致。
3、 檢查網(wǎng)絡(luò)連通性。要能ping通服務(wù)器的IP及服務(wù)器名
4、 檢查客戶端是否能夠通過服務(wù)器的Windows認(rèn)證:
Net view \\servername
Net use \\servername\IPC$
如果兩條命令出錯(cuò),則表明有訪問SQL Server服務(wù)器權(quán)限上的問題。
5、 確保客戶端登錄賬號(hào)有權(quán)限訪問SQL Server。
一些常見的連接問題:
一、多數(shù)是客戶端沒找到命名管道服務(wù)器即SQL Server
[Named Pipes]SQL Server does not exist or access denied.
[Named Pipes]ConnectionOpen(Connect()).
解決方法:
(1)、檢查網(wǎng)絡(luò)連通性,如ping
(2)、檢查SQLServer服務(wù)器端和客戶端的命名管道配置
二、訪問權(quán)限:
Login failed for user ‘NULL’或Login failed foruser anonymous
表明連通沒問題,只是命名管道訪問服務(wù)器權(quán)限上的問題。不要忘記IPC$共享,沒有權(quán)限訪問IPC$就無法使用命名管道。可以運(yùn)行:
net use \\servername\IPC$ 來測(cè)試
三、訪問權(quán)限2:
Login failed for user ‘User123’
表明該用戶沒用權(quán)限訪問服務(wù)器的資源或者SQLServer。不是連接問題,而是權(quán)限問題
為了避免上面問題:
(1) 建立連接后,如何查看使用的協(xié)議?可以在SSMS中運(yùn)行:
Net_library說明了協(xié)議,如果為L(zhǎng)PC,代表使用Shared Memory
(2) 除了使用SSMS之外,另一個(gè)就是ODBC數(shù)據(jù)源。運(yùn)行:ODBCAD32.exe。
使用該工具嘗試連接到SQL Server的系統(tǒng)DSN。如果報(bào)錯(cuò),證明連接有問題。報(bào)錯(cuò)的時(shí)候會(huì)返回錯(cuò)誤號(hào),可以使用“net helpmsg 錯(cuò)誤號(hào)”來查詢。
三、連接失敗檢查步驟——TCP/IP
TCP/IP協(xié)議有兩個(gè)基本東西:IP地址和端口號(hào)。
添加TCP/IP時(shí),需要重啟服務(wù)器。
對(duì)于端口號(hào),可以在配置工具中點(diǎn)解TCP/IP,然后選擇屬性,可以看到其偵聽的端口號(hào):
只要端口未被其他進(jìn)程占用,就可以改變這個(gè)端口號(hào)。一般高于5000的端口號(hào)都可以使用。從1024~5000的端口號(hào)經(jīng)常會(huì)被系統(tǒng)和程序占用,所以不建議取這個(gè)范圍??梢詮倪@個(gè)連接查看Windows系統(tǒng)使用的端口號(hào):
http://support.microsoft.com/?id=832017
或者可以使用netstat命令查看偵聽的端口:netstat –an可以看到系統(tǒng)所有使用中的端口號(hào)。
客戶端TCP/IP協(xié)議配置:
客戶端默認(rèn)開啟TCP/IP。也可以使用cliconfg.exe來配置。如果默認(rèn)實(shí)例不是1433,則需要在Default port做相應(yīng)改變。也可以使用別名指定服務(wù)器的端口。也可以使用動(dòng)態(tài)端口,如圖:
TCP/IP連接問題的解決步驟:
步驟1:驗(yàn)證SQLServer是否確實(shí)監(jiān)聽了TCP/IP協(xié)議:
驗(yàn)證協(xié)議也需要查看errorlog。如果看到下面一樣,證明已經(jīng)監(jiān)聽了TCP/IP
如果發(fā)現(xiàn)沒有監(jiān)聽,可以使用服務(wù)器網(wǎng)絡(luò)配置工具【svrnetcn.exe】配置。此工具需要下載。
步驟2:驗(yàn)證服務(wù)器監(jiān)聽的TCP/IP端口和客戶端配置的默認(rèn)值或別名中指定的值一致:
除了配置一樣之外,客戶端連接的默認(rèn)端口需要和SQLServer服務(wù)器監(jiān)聽的一致。如果有別名,需要仔細(xì)查看其指定的端口是否正確。
步驟3:檢查網(wǎng)絡(luò)連通性:
要確保不僅ping同SQLServer服務(wù)器的IP地址,也要能ping通sqlserver服務(wù)器的名稱。如果名字ping不同,說明DNS或WINS服務(wù)器配置有問題,可以在HOSTS文件(system32\drivers\etc下)中手工加入IP地址和服務(wù)器對(duì),如:
169.254.173.244 MySQLServer
步驟4:使用telnet命令檢查SQLServer監(jiān)聽的端口:
要驗(yàn)證SQLServer監(jiān)聽的端口,可以使用telnet命令,假設(shè)IP為192.168.1.1,端口為1234,可以使用:telnet192.168.1.1 1234。如果成功,那么會(huì)顯示一個(gè)光標(biāo)在閃的黑色屏幕。如果不成功會(huì)返回錯(cuò)誤信息。
步驟5:檢查登錄用戶的SQLServer訪問權(quán)限:
和命名管道一樣,必須確??蛻舳说卿涃~號(hào)有權(quán)限訪問SQL Server。
為了減少配置錯(cuò)誤,可以使用以下措施:
1、 配置多個(gè)靜態(tài)端口:
只需使用服務(wù)器網(wǎng)絡(luò)配置工具在TCP/IP協(xié)議屬性中輸入多個(gè)逗號(hào)分隔的端口號(hào)就可以了。雖然監(jiān)聽多個(gè)端口的意義不大,如果認(rèn)為有網(wǎng)絡(luò)性能問題,還不如增加網(wǎng)卡,這樣比提升多端口要好得多。
2、 TCP/IP端口綁定失?。?/p>
如果靜態(tài)端口被占用,會(huì)出現(xiàn)以下錯(cuò)誤信息:
Server SuperSocket Info: Bind failed on TCP port 1433.
對(duì)此,可以指定其他端口,或停用一些服務(wù)再重啟SQLServer服務(wù)。如果想查看什么程序占用端口,可以使用PortQry.exe(需下載)獲取。使用說明:
http://support.microsoft.com/default.aspx?kbid=310099
例子:protqry –n Myserver –p TCP –e 1433
3、 檢查連接使用的協(xié)議:
通過SSMS執(zhí)行下面語句即可:
4、 如何訪問防火墻后面的SQLServer:
必須配置防火墻以允許從*ANY*(大于1024的端口)到1433的通信量,及從1433到*ANY*的通信量。
具體說明可以參考技術(shù)文檔:
http://support.microsoft.com/?id=287932
5、 在ManagementStudio中指定連接的協(xié)議和端口:
可以強(qiáng)制使用TCP/IP連接服務(wù)器指定端口。
6、 其他:
在以上步驟都不成功的時(shí)候,使用Network Monitor工具捕捉網(wǎng)絡(luò)包來分析。它可以獲取一些其他手段找不到的原因。詳細(xì)參考:
http://support.microsoft.com/default.aspx?kbid=148942
四、一般性網(wǎng)絡(luò)錯(cuò)誤(GeneralNetwork Error)
1、 可能發(fā)生在連接生命周期的任何一步:
這個(gè)問題和“SQL Server doesn’t exists or access denied”有本質(zhì)區(qū)別,后者是連不到SQLServer服務(wù),但前者是已經(jīng)找到SQLServer服務(wù),但連接在建立、傳送客戶端查詢指令,或收到SQLServer返回的數(shù)據(jù)結(jié)果集的任何一步發(fā)生了異常中斷。此時(shí)要檢查錯(cuò)誤的詳細(xì)信息:
2、 一般只是偶爾發(fā)生,或者集中在某個(gè)時(shí)間段發(fā)生,而且很可能會(huì)自動(dòng)消失:
如果時(shí)有時(shí)無,就需要抓一組Network Monitor的日志,甚至是Windows的內(nèi)核跟蹤,總能定位問題。
3、 問題產(chǎn)生的可能原因非常多:
常見原因:
1. 服務(wù)器的負(fù)荷:
如果服務(wù)器負(fù)荷高,有可能在網(wǎng)絡(luò)中會(huì)發(fā)出很多RESET包,在超過重試次數(shù)后,客戶端會(huì)中斷連接,拋出GNE。這類問題會(huì)影響所有連接,甚至在SQLServer服務(wù)器上的本地連接。
2. 繁忙的應(yīng)用服務(wù)器沒有使用連接池:
在三層應(yīng)用結(jié)構(gòu)中,中間層應(yīng)用服務(wù)器會(huì)同時(shí)接受大量的數(shù)據(jù)庫登出登入請(qǐng)求,如果沒有使用連接池,SQLServer需要維護(hù)連接的負(fù)擔(dān)會(huì)非常重??赡軙?huì)有少數(shù)連接照顧不過來,容易遇到GNE。如果開啟連接池,負(fù)載就能大大降低,問題也就可以解決了。
3. 網(wǎng)絡(luò)傳輸層問題:
由于數(shù)據(jù)庫經(jīng)常要傳輸大量的結(jié)果集,網(wǎng)絡(luò)層比較繁忙。如果兩臺(tái)計(jì)算機(jī)之間的網(wǎng)絡(luò)有頻繁重傳現(xiàn)象,或者特定類型的網(wǎng)絡(luò)包被某個(gè)網(wǎng)絡(luò)設(shè)備(網(wǎng)關(guān)、路由、防火墻等)修改或丟棄,那么GNE出現(xiàn)幾率比較高。這類問題只發(fā)生在特定的一組SQLServer服務(wù)器和客戶端之間。同一個(gè)SQLServer可能有寫客戶端沒有問題,有些有問題??缇W(wǎng)段或跨子網(wǎng)的客戶端問題比較多。
4. Windows操作系統(tǒng)層面問題:
SQLServer的連接由Windows建立和維護(hù),所以Windows層面的許多行為會(huì)影響SQLServer的連接穩(wěn)定性。當(dāng)數(shù)據(jù)庫、網(wǎng)絡(luò)很繁忙時(shí),Windows為了維護(hù)自身安全,會(huì)有意拒絕一些網(wǎng)絡(luò)請(qǐng)求。造成誤殺。
5. 不恰當(dāng)?shù)南到y(tǒng)設(shè)置:
有時(shí)候會(huì)從安全性角度考慮,修改一些系統(tǒng)設(shè)置,但是過于嚴(yán)厲的話會(huì)導(dǎo)致SQLServer連接的不穩(wěn)定。常見的是TCP設(shè)置,在
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters下。
SQLServer層的設(shè)置也有兩個(gè)地方可能引起GNE錯(cuò)誤,都在sp_configure中:
l Priority boost:SQLServer以高優(yōu)先級(jí)啟動(dòng)。一般情況下不推薦設(shè)置。
l Lightweight pooling:會(huì)使SQLServer切換到纖程模式計(jì)劃。會(huì)影響SQLServer的運(yùn)行模式,有時(shí)會(huì)帶來GNE副作用。由于大部分情況下不會(huì)帶來明顯的性能提高,所以不建議使用。
6. 防毒軟件和防火墻:
這些軟硬件有可能導(dǎo)致誤殺現(xiàn)象。
7. 網(wǎng)絡(luò)設(shè)備:
有些應(yīng)用會(huì)長(zhǎng)時(shí)間連接數(shù)據(jù)庫,幾乎從來不登出。如果沒有操作請(qǐng)求,連接會(huì)長(zhǎng)時(shí)間處于空閑狀態(tài)。對(duì)于這樣的TCP連接,SQLServer會(huì)每隔30秒做一次KeepAlive握手。確保連接是否有效。如果客戶端對(duì)此沒有反饋,SQLServer會(huì)中斷這個(gè)連接。當(dāng)客戶端下次使用時(shí),就會(huì)收到GNE。有些網(wǎng)絡(luò)設(shè)備會(huì)在空閑30~40分鐘后直接斷開連接。也會(huì)直接導(dǎo)致GNE。
8. 錯(cuò)誤的網(wǎng)卡配置:
在集群服務(wù)器上,至少有兩塊網(wǎng)卡。如果心跳線也能訪問公共網(wǎng)絡(luò),就容易出現(xiàn)GNE。
4、 GNE情況很多,但是還是可以做以下的操作,減緩或者解決:
1. 分析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),確定網(wǎng)絡(luò)的可靠性
2. 涉及SQLServer服務(wù)器和客戶端服務(wù)器做全面健康檢查,確認(rèn)它的工作正常。
l Windows日志中不可以有明顯的錯(cuò)誤
l CPU不可以長(zhǎng)時(shí)間100%
l Windows不可以有系統(tǒng)緩存及內(nèi)存方面的問題。
l SQL Server的errorlog里不可以有明顯的錯(cuò)誤,重點(diǎn)錯(cuò)誤是:AV、內(nèi)存、磁盤、17883/17884
l SQLServer不可以發(fā)生大范圍、涉及100個(gè)以上的連接阻塞問題。
l 檢查sysprocesses系統(tǒng)視圖,不可出現(xiàn)經(jīng)常有大量連接處于runnable/running狀態(tài)。
3. 按照下面方式配置SQLServer服務(wù)器和客戶端服務(wù)器:
(1)、禁用RSS:
找到注冊(cè)表:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\EnableRSS,將其設(shè)為0.
(2)、禁用TaksOffload:
找到注冊(cè)表:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\DisableTaskOff,將其設(shè)為1
(3)、禁用TCP Chimney:
輸入:netsh in tip set chimney DISABLED
(4)、禁用TCPA:
找到注冊(cè)表:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\EnableTCPA,將其設(shè)為0.
(5)、重啟機(jī)器使設(shè)置生效。
(6)、將所有有關(guān)系的機(jī)器Windows升級(jí)到最新的更新版本。網(wǎng)絡(luò)設(shè)備firmware升級(jí)到最新。
(7)、檢查SQLServer sp_configure里面priority boost和lightweight pooling是否被改動(dòng)過。
4. 正確配置網(wǎng)絡(luò):
(1)、確認(rèn)注冊(cè)表:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters下都是默認(rèn)配置
(2)、再次確認(rèn)沒有配置網(wǎng)卡的Teaming。
(3)、在集群環(huán)境里,確認(rèn)兩塊網(wǎng)卡配置正確。
(4)、確認(rèn)網(wǎng)羅設(shè)備自動(dòng)關(guān)閉Idle連接的功能已經(jīng)被禁用。
(5)、暫時(shí)關(guān)閉防毒軟件和防火墻。
(6)、如果可能,盡量將SQLServer服務(wù)器和客戶端服務(wù)器移到物理上比較近、中間網(wǎng)絡(luò)設(shè)備比較少的網(wǎng)段。修改連接配置,換一種網(wǎng)絡(luò)協(xié)議。
聯(lián)系客服