硬件配置:
兩臺(tái)HP服務(wù)器,3G CPU ,2G內(nèi)存, C盤20G ,D盤50g,雙網(wǎng)卡,共享存儲(chǔ)為msa1000系列,容量為820g。
軟件配置:
Windows server 2003 企業(yè)版,32位系統(tǒng)。(集群中所有機(jī)器安裝)
Oracle ofs3.3.4 (集群中所有機(jī)器安裝)
Oracle9i (集群中所有機(jī)器安裝)
注意:操作系統(tǒng)必須為2003企業(yè)版或2003 datacentre版。
系統(tǒng)配置參數(shù):
節(jié)點(diǎn)1(主節(jié)點(diǎn))
節(jié)點(diǎn)2(備節(jié)點(diǎn))
主機(jī)名
qhltdb2
qhlt-1mc
Public ip
10.251.8.55/24
10.251.8.56/24
Private ip
11.11.11.1/24
11.11.11.2/24
集群名
cluster
集群IP
10.251.8.144/24
Oracle集群名
mycluster
Oracle集群IP
10.251.8.60/24
系統(tǒng)結(jié)構(gòu):
具體安裝步驟:
1, 安裝2003企業(yè)版操作系統(tǒng),兩機(jī)均使用administrator用戶登陸,密碼也保持一致。
2, 配置windows MSCS。
在配置windows群集之前,需配置好網(wǎng)絡(luò),共享磁盤,以及windows域。
網(wǎng)絡(luò)配置:
為了方便配置,我們將公用網(wǎng)卡重命名為public,私有網(wǎng)卡重命名為private
并將IP配好。私有網(wǎng)卡之間用交叉線相連。且關(guān)閉私有網(wǎng)卡的tcpip的netbios設(shè)置。
配置網(wǎng)絡(luò)的時(shí)候,微軟推薦把共享存儲(chǔ)關(guān)閉,但不是必須。
域設(shè)置:
群集中的所有節(jié)點(diǎn)必須是同一個(gè)域的成員,并可以訪問(wèn)域控制器和DNS服務(wù)器??梢酝ㄟ^(guò)兩種方式解決:
1, 雙節(jié)點(diǎn)中,兩節(jié)點(diǎn)均為域控制器,主節(jié)點(diǎn)為主域控制器及DNS服務(wù)器,備節(jié)點(diǎn)為額外域控制器,備節(jié)點(diǎn)的DNS服務(wù)器指向主域控制器。
2, 兩節(jié)點(diǎn)均為同一域中的成員服務(wù)器。
我們選擇的第一種方式,域名自選。此例為qhlt.com
將主節(jié)點(diǎn)配置為域控制器,使用配置您的服務(wù)器向?qū)?,根?jù)步驟 一步一步繼續(xù),在DNS轉(zhuǎn)發(fā)一項(xiàng)選擇否。還要注意不要配置VPN防火墻!這個(gè)過(guò)程大概需要15分鐘。配置完重啟計(jì)算機(jī)。
然后配置備份節(jié)點(diǎn)為額外域控制器,在備機(jī)的cmd下輸入dcpromo,根據(jù)步驟繼續(xù),選擇配置為額外域控制器,其他繼續(xù),這個(gè)過(guò)程大概要10分鐘。完后重啟機(jī)器。
確定兩臺(tái)計(jì)算機(jī)重啟后 是以域用戶administrator 登陸操作系統(tǒng)。
共享磁盤配置:
1, 啟動(dòng)主節(jié)點(diǎn),關(guān)閉備節(jié)點(diǎn),開啟共享磁盤
2, 在主節(jié)點(diǎn)上配置共享磁盤。
3, 打開我的電腦-管理-磁盤管理
4, 右擊“未分配的磁盤空間”。
5, 單擊“新分區(qū)”。
6, 將啟動(dòng)“新建分區(qū)向?qū)?#8221;,單擊“下一步”。
7, 選擇“主分區(qū)”的分區(qū)類型,單擊“下一步”。
8, 默認(rèn)將分區(qū)設(shè)為最小。單擊“下一步”。(建議采用多個(gè)邏輯磁盤,而不是在一個(gè)磁盤上采用多個(gè)分區(qū)。)
使用下拉框更改驅(qū)動(dòng)器盤符。使用在字母表上比默認(rèn)列舉的字母更靠后的驅(qū)動(dòng)器盤符。通常,驅(qū)動(dòng)器盤符“Q”可以用于仲裁磁盤,而“R”、“S”等字母則用于數(shù)據(jù)磁盤。
9, 使用NTFS格式化分區(qū)。在“卷標(biāo)”方框中,鍵入該磁盤的名稱。例如:“仲裁”如下方圖8所示。關(guān)鍵是要對(duì)共享磁盤分配驅(qū)動(dòng)器標(biāo)簽,因?yàn)樵谶€原磁盤時(shí)這會(huì)大大減少故障排除時(shí)間。微軟推薦仲裁盤為物理上的單獨(dú)磁盤,但不是必須。
根據(jù)以上步驟 繼續(xù)配置共享 分區(qū),例如S:\,微軟推薦共享邏輯驅(qū)動(dòng)器至少為兩個(gè)。
1. 啟動(dòng)“Windows Explorer”。
2. 右擊一個(gè)共享磁盤(比如:“驅(qū)動(dòng)器Q:\”),單擊“新建”,然后單擊“文本文檔”。
3. 確認(rèn)您可以順利寫入磁盤,并創(chuàng)建了文件。
4. 選擇所創(chuàng)建的文件,然后按“Del”鍵,將其從群集磁盤刪除。
5. 對(duì)所有群集磁盤重復(fù)步驟1至4,確認(rèn)可以從第一個(gè)節(jié)點(diǎn)正確地訪問(wèn)它們。
6, 關(guān)閉第一個(gè)節(jié)點(diǎn),開啟第二個(gè)節(jié)點(diǎn),并重復(fù)步驟1至4,驗(yàn)證磁盤訪問(wèn)和功能。如果不能訪問(wèn),在備節(jié)點(diǎn)上重新執(zhí)行共享磁盤配置步驟。具體步驟要和在主節(jié)點(diǎn)上執(zhí)行步驟一致,包括各種參數(shù)等。
配置集群:
關(guān)閉除主節(jié)點(diǎn)以外的所有節(jié)點(diǎn),開啟共享盤陣。主節(jié)點(diǎn)以域用戶登陸。
在主節(jié)點(diǎn)上配置群集:
1. 依次單擊“開始”、“所有程序”和“管理工具”,然后單擊“群集管理器”。
2. 當(dāng)出現(xiàn)“打開群集連接向?qū)?#8221;提示時(shí),在“執(zhí)行”下拉列表中,單擊“創(chuàng)建新群集”,如下方圖9所示。
3. 確認(rèn)您具有配置群集所必需的前提條件,如下方圖10所示。單擊“下一步”。
4. 鍵入群集的唯一名稱(最多15個(gè)字符),即域名,qhlt.com,然后單擊“下一步”。(在下方圖11所示的例子中,群集被命名為 “Cluster”。
5. 如果您在本地登錄一個(gè)不屬于“具有本地管理特權(quán)的域帳戶”的帳戶,向?qū)⑻崾灸付ㄒ粋€(gè)帳戶。群集服務(wù)不會(huì)使用該帳戶進(jìn)行啟動(dòng)。即adminisrator,密碼 :
注意:如果您擁有正確的憑證,步驟5所提到的提示,如圖12所示,可能不會(huì)出現(xiàn)。
6. 由于可能對(duì)群集進(jìn)行遠(yuǎn)程配置,因此您必須確認(rèn)或鍵入將要作為第一個(gè)節(jié)點(diǎn)創(chuàng)建群集的服務(wù)器的名稱,如下方圖13所示。單擊“下一步”。
為群集中第一個(gè)節(jié)點(diǎn)的計(jì)算機(jī)名稱。
7. 下方圖 14顯示“安裝”程序現(xiàn)在將分析節(jié)點(diǎn),查找可能導(dǎo)致安裝出現(xiàn)問(wèn)題的硬件或軟件問(wèn)題。檢查所有警告或錯(cuò)誤信息。您還可以單擊“詳細(xì)信息”按鈕,了解有關(guān)每個(gè)警告或提示的詳細(xì)信息。
圖 14. “安裝”程序分析節(jié)點(diǎn),查找可能存在的硬件或軟件問(wèn)題。
8. 鍵入唯一的群集IP地址(本例為:10.251.8.144)該地址需要與計(jì)算機(jī)公網(wǎng)IP處于一個(gè)網(wǎng)段,然后單擊“下一步”。
9. 鍵入在預(yù)安裝時(shí)創(chuàng)建的群集服務(wù)帳戶的“用戶名”和“密碼”。(在下方圖16的例子中,用戶名為:“Cluster(群集)”)在“域”下拉列表中選擇域名,然后單擊“下一步”。
這時(shí),“群集配置向?qū)?#8221;將驗(yàn)證用戶帳戶和密碼。
因?yàn)楫?dāng)時(shí)我做的時(shí)候并沒(méi)有設(shè)置群集用戶,用的是域的管理用戶,所以如果出現(xiàn)這一步,也使用該administrator帳戶。
. 向?qū)崾灸峁┰陬A(yù)安裝時(shí)所創(chuàng)建的帳戶。
10. 檢查“摘要”頁(yè)面,如下方圖17所示,確認(rèn)所有將用于創(chuàng)建群集的信息均準(zhǔn)確無(wú)誤。如果需要,您可以使用仲裁按鈕,更改由默認(rèn)自動(dòng)選擇的磁盤指派的仲裁磁盤。
本屏幕上所顯示的摘要信息可用于在出現(xiàn)災(zāi)難恢復(fù)狀況時(shí),重新配置群集。建議您保存并打印一份硬拷貝,與服務(wù)器上的更改管理日志保持一致。
圖 17. 建議采用的“群集配置”頁(yè)面。
11. 檢查所有在群集創(chuàng)建過(guò)程中遇到的警告或錯(cuò)誤。具體操作是單擊加號(hào)查看更多信息,然后單擊“下一步”。出現(xiàn)在“創(chuàng)建群集”頁(yè)面的警告和錯(cuò)誤如圖18所示。
圖 18. 出現(xiàn)在“創(chuàng)建群集”頁(yè)面上的警告和錯(cuò)誤。
12. 單擊“完成”,結(jié)束安裝。下方圖19顯示最終的步驟。
圖 19. 設(shè)置一個(gè)新的服務(wù)器群集的最終步驟。
配置第二個(gè)節(jié)點(diǎn)
在另一個(gè)節(jié)點(diǎn)上安裝群集服務(wù)所需的時(shí)間要比花在第一個(gè)節(jié)點(diǎn)上的時(shí)間少。“安裝”程序基于第一個(gè)節(jié)點(diǎn)的配置,在第二個(gè)節(jié)點(diǎn)上配置群集服務(wù)網(wǎng)絡(luò)設(shè)置。與此同時(shí),您還可以通過(guò)遠(yuǎn)程操作為群集添加多個(gè)節(jié)點(diǎn)。
注意:對(duì)于本部分,開啟節(jié)點(diǎn)1和所有的共享磁盤,然后開啟所有其它節(jié)點(diǎn)。這時(shí),群集服務(wù)將控制對(duì)于共享磁盤的訪問(wèn),以便杜絕任何可能破壞卷的機(jī)會(huì)。
1. 在節(jié)點(diǎn)1上打開“群集管理器”。
2. 單擊“文件”,單擊“新建”,然后單擊“節(jié)點(diǎn)”。
3. 將啟動(dòng)“添加群集計(jì)算機(jī)向?qū)?#8221;,單擊“下一步”。
4. 如果您沒(méi)有通過(guò)正確的憑證進(jìn)行登錄,將要求您指定一個(gè)對(duì)群集中所有節(jié)點(diǎn)具有管理權(quán)利的域帳戶。
5. 輸入您要將其添加到群集的節(jié)點(diǎn)的機(jī)器名稱,單擊“添加”。重復(fù)該步驟,如下方圖21所示,添加您想要的其它節(jié)點(diǎn)。當(dāng)您添加完了所有的節(jié)點(diǎn),單擊“下一步”.
6. “安裝”向?qū)?duì)所有節(jié)點(diǎn)執(zhí)行分析,以便確認(rèn)它們得到了正確的配置。
7. 鍵入用于啟動(dòng)群集服務(wù)的帳戶密碼。(administrator)
8. 檢查所顯示的用于確認(rèn)的摘要信息。摘要信息將用于在其它節(jié)點(diǎn)加入群集時(shí)對(duì)其進(jìn)行配置。
9. 檢查群集創(chuàng)建過(guò)程中遇到的所有警告或錯(cuò)誤,然后單擊“下一步”。
10. 單擊“完成”,結(jié)束安裝。
測(cè)試:
測(cè)試:?jiǎn)?dòng)“群集管理器”,右擊一個(gè)資源,然后單擊“啟動(dòng)故障”。該資源將進(jìn)入故障狀態(tài),然后將重新啟動(dòng)并在同一節(jié)點(diǎn)上回到聯(lián)機(jī)狀態(tài)。
預(yù)期結(jié)果:資源將在相同的節(jié)點(diǎn)上返回聯(lián)機(jī)狀態(tài)
測(cè)試:在相同的資源上,再執(zhí)行上方“啟動(dòng)故障”測(cè)試三次。在第四次故障時(shí),資源將對(duì)群集中的另一個(gè)節(jié)點(diǎn)執(zhí)行故障轉(zhuǎn)移。
預(yù)期結(jié)果:資源將針對(duì)群集中的另一個(gè)節(jié)點(diǎn)實(shí)施故障轉(zhuǎn)移
測(cè)試:將所有資源轉(zhuǎn)移到一個(gè)節(jié)點(diǎn)上。啟動(dòng)“計(jì)算機(jī)管理”,然后單擊“服務(wù)與應(yīng)用程序”下方的“服務(wù)”,停止群集服務(wù)。在另一個(gè)節(jié)點(diǎn)上啟動(dòng)“群集管理器”,確認(rèn)所有資源均在該節(jié)點(diǎn)上正確地執(zhí)行了故障轉(zhuǎn)移并返回聯(lián)機(jī)狀態(tài)。
如果測(cè)試共享卷組等群集組的切換沒(méi)有問(wèn)題,則繼續(xù)下一步。
安裝ORACLE軟件
1, 打開兩臺(tái)機(jī)器,共享磁盤在主節(jié)點(diǎn)上可見。(也可能在備節(jié)點(diǎn),但只能在一個(gè)節(jié)點(diǎn)上可見)
2, 在主服務(wù)器上安裝Oracle,選擇自定義安裝,安裝過(guò)程不創(chuàng)建數(shù)據(jù)庫(kù),安裝結(jié)束重新啟動(dòng)主服務(wù)器;
3, 在從服務(wù)器上安裝Oracle,選擇自定義安裝,安裝過(guò)程不創(chuàng)建數(shù)據(jù)庫(kù),安裝結(jié)束重新啟動(dòng)從服務(wù)器。
4, 如果安裝的是oracle9201,建議升級(jí)數(shù)據(jù)庫(kù)先。9204或9206均可。
創(chuàng)建數(shù)據(jù)庫(kù)
在主服務(wù)器上創(chuàng)建要添加到集群中的數(shù)據(jù)庫(kù)。注意 Control 文件、redo log files 和 data files 必須創(chuàng)建在磁盤柜的共享分區(qū)上;初始化參數(shù)文件也要放在磁盤柜上。即將init.ora放在共享磁盤,只是將該文件內(nèi)容修改為:spfile=S:\oradata\spfile{SID}.ora。
創(chuàng)建數(shù)據(jù)庫(kù)的具體過(guò)程
1,在a機(jī)上創(chuàng)建數(shù)據(jù)庫(kù),數(shù)據(jù)文件 控制文件 ,redo日志文件,初始化參數(shù)文件,spfile等均放在共享磁盤上,例如S:\oradata。建完后,測(cè)試a機(jī)上啟動(dòng)數(shù)據(jù)庫(kù)成功。
2,關(guān)a機(jī),講共享磁盤切換到b機(jī),將在a機(jī)上建庫(kù)的所有數(shù)據(jù)文件所在目錄改名(或刪除),例如改為S:\oradata1,然后在b機(jī)上按相同參數(shù)建庫(kù),同時(shí)將所有文件放在共享磁陣上。然后在b機(jī)啟動(dòng)數(shù)據(jù)庫(kù)。
3,關(guān)b機(jī),切換磁盤到a機(jī),啟動(dòng)數(shù)據(jù)庫(kù),啟動(dòng)過(guò)程可能會(huì)報(bào)密碼文件損壞,將b機(jī)的密碼文件cp到a機(jī),再次啟動(dòng),確認(rèn)數(shù)據(jù)庫(kù)可正常啟動(dòng)。
4,關(guān)a機(jī),切換到b機(jī),再次確認(rèn)可正常啟動(dòng)數(shù)據(jù)庫(kù)。然后將磁盤切換到a機(jī)。
5,將a,b兩機(jī)器上的oracleserviceSID,oraclelistener服務(wù)設(shè)置為手動(dòng)啟動(dòng)。因?yàn)檫@兩個(gè)服務(wù)是由ofs來(lái)控制的。
6,建庫(kù)過(guò)程中不要配置lisner和tns等網(wǎng)絡(luò)參數(shù)。
安裝OSF
安裝Failsafe要在登陸域(不能以本機(jī)登陸)的方式,不然在驗(yàn)證數(shù)據(jù)庫(kù)時(shí)會(huì)出錯(cuò)。
Failsafe的版本要對(duì)應(yīng),否則在驗(yàn)證單機(jī)數(shù)據(jù)庫(kù)時(shí)無(wú)法通過(guò)。
在主服務(wù)器上安裝FailSafe3.3,安裝完重新啟動(dòng)主服務(wù)器;
再在從服務(wù)器上安裝FailSafe3.3,安裝完重新啟動(dòng)從服務(wù)器。
在安裝過(guò)程中需要輸入 域名/用戶;密碼接受驗(yàn)證。用戶為administrator。
注:在安裝完 fail safe 后,Windows 2000 中的群集管理器中 群集配置 –〉 資源類型 –〉 下會(huì)出現(xiàn)兩個(gè)資源類型:Oracle Database 和 Oracle TNS Listener,兩者使用的資源 DLL 都是 FsResOdbs.dll 。
如果沒(méi)有,啟動(dòng)Oracle Services for MSCS服務(wù),或進(jìn)行verify cluster后將會(huì)出現(xiàn)。
在兩臺(tái)機(jī)器上修改HOSTS文件
在目錄c:\winnt\system32\drivers\etc\hosts 內(nèi)容如下:兩臺(tái)機(jī)器上相同
10.251.8.55 qhltdb2
10.251.8.56 qhlt-1mc
10.251.8.144 cluster
10.251.8.60 mycluster
然后在兩臺(tái)機(jī)器上分別ping以上地址或主機(jī)名,確保解析正確。
集群配置
1、 在主節(jié)點(diǎn)上打開 Oracle Fail Safe Manager
Start -> Programs -> OraHome91> -> Oracle Fail Safe Manager
打開后出現(xiàn) Add Cluster to Tree 對(duì)話框,在該對(duì)話框里輸入 CLUSTER 名稱,會(huì)提示輸入在域里有管理權(quán)限的用戶名和密碼;輸入后會(huì)出現(xiàn) Verify Cluster 對(duì)話框,對(duì)該集群各項(xiàng)資源進(jìn)行有效性驗(yàn)證;
2、 在每臺(tái)節(jié)點(diǎn)機(jī)上檢查是否有服務(wù) OracleMSCSServices,并啟動(dòng)該服務(wù),該服務(wù)為手動(dòng)。
3、 在每臺(tái)節(jié)點(diǎn)機(jī)上啟動(dòng)集群管理器(啟動(dòng) -> 程序 -> 管理工具 -> 集群管理器),在 Cluster Group 檢查是否有 Oracle Services for MSCS 這一項(xiàng);并檢查 Resource Types 中是否有 Oracle Database 和 Oracle TNS Listener。
以下步驟只需在主節(jié)點(diǎn)執(zhí)行:
4、 在 Oracle Fail Safe Manager 中的Groups 菜單里選擇 Create;打開 Create Group Wizard 后可以設(shè)置 failover 和 failback 策略,并自動(dòng)打開 Add Resource to Group Wizard 可以向組添加virtual address(選擇Resources,然后Add to Group)。
首先選擇菜單:
出現(xiàn)界面,輸入組名:
點(diǎn)擊下一步,選擇是否failback,建議不選擇failback,此選項(xiàng)將允許回切;選擇prevent將使用默認(rèn)的failback模式。
點(diǎn)擊下一步,選擇優(yōu)先級(jí)別:
按完成結(jié)束組的創(chuàng)建。
向組里添加虛擬地址
5、 在 Troubleshooting 菜單上選擇 Verify Standalone Database 驗(yàn)證 Oracle數(shù)據(jù)庫(kù)以及 Oracle Net 配置,該命令確認(rèn) Oracle Fail Safe 可以訪問(wèn)數(shù)據(jù)庫(kù),并且 standlone 數(shù)據(jù)庫(kù)位于共享分區(qū)上;此步驟可能會(huì)提示 你 是否需要?jiǎng)h除 備份節(jié)點(diǎn)上的duplicate 庫(kù),選擇是 刪除duplicate庫(kù)。此步驟主要是用來(lái)發(fā)現(xiàn)驗(yàn)證配置,提示你修改錯(cuò)誤。
另外:由于9i以后是以spfile啟動(dòng),所以下圖中的Parameter 的值可以輸入共享陣列上spfile文件,或者修改陣列上init.ora文件內(nèi)容為spfile=/S:\oradata\spfile{SID}.ora,當(dāng)然在配置完ofs后,還可以通過(guò)ofs管理工具修改,但未測(cè)試過(guò)。
選擇是,刪除duplicate庫(kù)。
6、 在 Resources 菜單上選擇 Add to Group,然后選擇 Oracle Database打開 Add Resource to Group Wizard,該向?qū)в脕?lái)將 single-instance Oracle database server 配置為基于 MSCS 的高可用性數(shù)據(jù)庫(kù)服務(wù)器;
選擇菜單:
出現(xiàn)界面,選擇OracleDatabase:
出現(xiàn)配置集群界面:
安裝成功后,出現(xiàn)如下圖提示,則安裝成功完成。
安裝成功后,關(guān)于數(shù)據(jù)庫(kù)在注冊(cè)表中的配置,從服務(wù)器上的注冊(cè)表將會(huì)自動(dòng)和主服務(wù)器同步。
注:在 FailSafe 里添加組mycluster并將數(shù)據(jù)庫(kù)群集添加后,在群集管理器里也增加了該組,組包含的內(nèi)容有:
3.10測(cè)試
1) 手工切換主從機(jī)
從主機(jī)切換到從機(jī),切換時(shí)間為50秒,應(yīng)用程序略有停滯感,切換成功后應(yīng)用恢復(fù)正常。
2) 非正常關(guān)機(jī)
非正常關(guān)掉主服務(wù)器,可以正常切換,切換時(shí)間為57秒,應(yīng)用程序略有停滯,切換成功后應(yīng)用恢復(fù)正常。
3) 拔掉主機(jī)應(yīng)用網(wǎng)線
拔掉主機(jī)應(yīng)用網(wǎng)線之后,可以正常切換,切換時(shí)間為50秒,應(yīng)用程序略有停滯感,切換成功后應(yīng)用恢復(fù)正常。
4) 在主機(jī)上正常shutdown immediate 數(shù)據(jù)庫(kù),但卻不能關(guān)閉,數(shù)據(jù)庫(kù)會(huì)自動(dòng)重啟動(dòng)
如果出現(xiàn)不斷在主機(jī)上重新啟動(dòng)數(shù)據(jù)庫(kù)的情況,那需要在ofs中修改mycluster組中數(shù)據(jù)庫(kù)的restart策略屬性。
在安裝中可能出現(xiàn)的問(wèn)題:
1, 如何卸載ofs?
卸載ofs使用安裝程序所帶的oui執(zhí)行卸載產(chǎn)品就可以。
2, 如何刪除ofs在MSCS中創(chuàng)建的組?
先卸載ofs產(chǎn)品,然后將組中的所有資源刪除,之后就可以刪除組了。再在cmd下運(yùn)行
sc delete 服務(wù)名 刪除由ofs創(chuàng)建的oralce群集服務(wù)oraclelisnerfsmycluster。至此,ofs在計(jì)算機(jī)上基本上刪除,資源類型里面的兩個(gè)選項(xiàng)可以不用理會(huì),在重新裝好ofs后,還可以繼續(xù)使用。
3,除了clusterservice 服務(wù)為自動(dòng)啟動(dòng),oralceservice{sid} ,oraclelisner ,oracleMSCSservice,oraclelisnerfsmycluster 服務(wù)均為手動(dòng)啟動(dòng),這些服務(wù)由ofs控制!
Oracle Fail Safe安裝步驟
硬件環(huán)境:兩臺(tái)Dell 2950
磁盤陣列:DFT502 在操作系統(tǒng)認(rèn)到共享的盤整后只需要在主服務(wù)器上格式化,備用服務(wù)器不能再次格式化共享盤陣,需要需要修改盤陣的邏輯盤符與主服務(wù)器保持一致。設(shè)置共享盤陣時(shí)服務(wù)器只能有一臺(tái)開啟,另外一臺(tái)關(guān)閉。
軟件環(huán)境:
操作系統(tǒng):Microsoft Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition。 注意:如果專業(yè)版,否則在安裝MSCS報(bào)操作系統(tǒng)版本的錯(cuò)誤。安裝專業(yè)版時(shí),使用的是同一個(gè)序列號(hào),使用不同的序列號(hào)安裝MSCS沒(méi)有測(cè)試,我認(rèn)為不是這個(gè)原因,因?yàn)槠髽I(yè)版使用的是相同的序列號(hào)。
數(shù)據(jù)庫(kù):Oracle 9.2.01
高可用軟件:MSCS、Oracle Fail Safe ofs334Kit_32bit
說(shuō)明:本文檔是建立在 MSCS 已經(jīng)正確安裝和配置基礎(chǔ)上的,詳細(xì)的安裝文檔請(qǐng)“參考Windows2003服務(wù)器在IP-SAN下MSCS群集配置指南.pdf”(產(chǎn)品中心已經(jīng)提供)。
Oracle Fail Safe 是架構(gòu)在 Microsoft Cluster Server(MSCS)上的一個(gè) Oracle 產(chǎn)品,為提供 Oracle 的一些產(chǎn)品(數(shù)據(jù)庫(kù)、Oracle Application Server 等)提供高可用性,因此在安裝此產(chǎn)品之前,必須正確安裝和配置 MSCS。
安裝步驟:
1、 在節(jié)點(diǎn)一上安裝 Oracle 9.2.01;
2、 重新啟動(dòng)節(jié)點(diǎn)一;
3、 在節(jié)點(diǎn)二上安裝Oracle 9.2.01;
4、 重新啟動(dòng)節(jié)點(diǎn)二;
注意:安裝過(guò)程中不能建立數(shù)據(jù)庫(kù)實(shí)例、監(jiān)聽,只安裝oracle系統(tǒng),安裝路徑兩臺(tái)服務(wù)器一致,安裝路徑在服務(wù)器的本地磁盤上。 兩個(gè)節(jié)點(diǎn)打補(bǔ)?。簝蓚€(gè)節(jié)點(diǎn)的oracle系統(tǒng)安裝安裝完畢后,在每個(gè)節(jié)點(diǎn)分別停止所有的ORACLE服務(wù),安裝補(bǔ)丁,補(bǔ)丁的安裝路徑必須與ORACEL系統(tǒng)的路徑保持一致。 5、 在節(jié)點(diǎn)一上創(chuàng)建要添加到集群中的數(shù)據(jù)庫(kù),新數(shù)據(jù)庫(kù)不要配置 Net8,即不要配置 listener.ora 和 tnsnames.ora 文件。 注意: Control 文件、redo log files 和 data files 必須創(chuàng)建在磁盤柜的共享分區(qū)上;其他文件可以安裝在本地磁盤,也可以安裝在磁盤柜的共享分區(qū)上。詳細(xì)步驟參考附錄1: 說(shuō)明:這一步最好不做,兩臺(tái)服務(wù)器上安裝OFS完畢后,再建立數(shù)據(jù)庫(kù),否則建立配置OFS過(guò)程中可能失敗。
6、 在節(jié)點(diǎn)一和節(jié)點(diǎn)二的注冊(cè)表中相應(yīng)位置添加第五步所創(chuàng)建的數(shù)據(jù)庫(kù)的 ORACLE_SID;
7、 在節(jié)點(diǎn)一上安裝 FailSafe 3.3;
8、 重新啟動(dòng)節(jié)點(diǎn)一;
9、 在節(jié)點(diǎn)二上安裝 FailSafe 3.3;
10、 重新啟動(dòng)節(jié)點(diǎn)二;
注意:Oracle FailSafe必需安裝在獨(dú)立的路徑下,不能與ORACLE系統(tǒng)一致。
11、 在兩臺(tái)機(jī)器上修改文件c:\windows\system32\drivers\etc\hosts 如下:
127.0.0.1
192.168.10.1 clunode1 (節(jié)點(diǎn)1)
192.168.10.2 clunode2 (節(jié)點(diǎn)2)
192.168.10.100 mycluster (MSCS Cluster 的別名,也就是虛擬 IP的別名)
192.168.10.101 client1 (Oracle 集群使用的 IP 和網(wǎng)絡(luò)名稱)
注意節(jié)點(diǎn)上listener 使用的 IP 地址應(yīng)該是虛擬 IP;
12、 打開 Oracle Fail Safe Manager
Start -> Programs -> OraHome91> -> Oracle Fail Safe Manager
打開后出現(xiàn) Add Cluster to Tree 對(duì)話框,在該對(duì)話框里輸入 CLUSTER 名稱,會(huì)
提示輸入在域里有管理權(quán)限的用戶名和密碼;輸入后會(huì)出現(xiàn) Verify Cluster 對(duì)話
框,對(duì)該集群各項(xiàng)資源進(jìn)行有效性驗(yàn)證;
13、 在每臺(tái)節(jié)點(diǎn)機(jī)上檢查是否有服務(wù) OracleMSCSServices,并啟動(dòng)該服務(wù);
14、 在每臺(tái)節(jié)點(diǎn)機(jī)上 啟動(dòng)集群管理器(啟動(dòng) -> 程序 -> 管理工具 -> 集群管理器),在 Cluster Group 檢查是否有 Oracle Services for MSCS 這一項(xiàng);并檢查 Resource Types 中是否有 Oracle Database 和 Oracle TNS Listener。
15、 在 Oracle Fail Safe Manager 中的Groups 菜單里選擇 Create;打開 Create Group Wizard 后可以設(shè)置 failover 和 failback 策略,并自動(dòng)打開 Add Resource to Group Wizard 可以向組添加virtual address(選擇Resources,然后Add to Group)。
16、 在 Troubleshooting 菜單上選擇 Verify Standalone Database 驗(yàn)證 Oracle數(shù)據(jù)庫(kù)以及 Oracle Net 配置,該命令確認(rèn) Oracle Fail Safe 可以訪問(wèn)數(shù)據(jù)庫(kù),并且 standlone 數(shù)據(jù)庫(kù)位于共享分區(qū)上;
這一步也可以不做,17中會(huì)自動(dòng)執(zhí)行16的驗(yàn)證。
17、 在 Resources 菜單上選擇 Add to Group,然后選擇 Oracle Database打開 Add Resource to Group Wizard,該向?qū)в脕?lái)將 single-instance Oracle database server 配置為基于 MSCS 的高可用性數(shù)據(jù)庫(kù)服務(wù)器;
注意:在配置OFS時(shí),指定oracle的啟動(dòng)參數(shù)是一定要pfile,使用spfile報(bào)錯(cuò),可能是oracle的bug。在OFS和oracle的高版本中沒(méi)有測(cè)試,使用spfile是否報(bào)錯(cuò)不能確定。
其他說(shuō)明:
在安裝完 fail safe 后,Windows 2003 中的群集管理器中 群集配置 –〉 資源類型 –〉 下會(huì)出現(xiàn)兩個(gè)資源類型:Oracle Database 和 Oracle TNS Listener,兩者使用的資源 DLL 都是 FsResOdbs.dll 。
在 FailSafe 里添加組 oragroup 并將數(shù)據(jù)庫(kù)群集添加后,在群集管理器里也增加了該組,組包含的內(nèi)容有:IP Address 192.168.101.71、Network Name oradb、Disk R:、OracleOraHome92TNSListenerFslscsi9201 和 oradb(數(shù)據(jù)庫(kù)實(shí)例名)
從單臺(tái)IBM x服務(wù)器升級(jí)為MSCS+OFS的HA:
升級(jí)前: 一臺(tái)服務(wù)器跑Windows 2003 entERPrise server + SQL SERVER + Oracle 10g R1
先增加一臺(tái)同樣服務(wù)器,加一個(gè)IBM的陣列,配置HA:
配置存儲(chǔ)和域,心跳網(wǎng)絡(luò)由另一人完成,共享存儲(chǔ)就劃一塊盤 : Quorum就一塊盤
,
第二個(gè)節(jié)點(diǎn)是將第一臺(tái)系統(tǒng)Ghost過(guò)去,然后改名,改IP的,免了安裝Oracle軟件等
我來(lái)配置MSCS+OFS(第一次玩這個(gè),
),以下是簡(jiǎn)要步驟:
網(wǎng)絡(luò)IP對(duì)應(yīng):
服務(wù)器 網(wǎng)絡(luò)類型: ip地址
serverA Public 192.168.3.101
serverA HeartBeat 192.168.6.1
serverB Public 192.168.3.102
serverB HeartBeat 192.168.6.2
MSCS配置: 群集名: HACLUSTER ; 群集地址: 192.168.3.1
OFS配置 : OFS名稱: HAOFS ; OFS地址: 192.168.3.103
1. 配置MSCS
關(guān)閉serverB,只啟動(dòng)serverA,
a.
開始 -->管理工具-->群集管理器,從對(duì)話框中選擇創(chuàng)建群集,根據(jù)向?qū)?chuàng)建群集 : HACLUSTER
b. serverA 配置完成后,這時(shí)才可以啟動(dòng)serverB,同樣選擇開始 -->管理工具-->群集管理器,
這次是添加節(jié)點(diǎn)到群集
出現(xiàn)群集添加節(jié)點(diǎn)向?qū)?并輸入群集或服務(wù)器名,將serverB加入到群集.
--需要輸入管理員的域用戶名 / 密碼
--MSCS就配置完成啦.
2. 配置OFS
a. 關(guān)閉serverB,只啟動(dòng)serverA ,
安裝ofs, 這個(gè)OFS必須安裝在自己的目錄,并且不能在共享磁盤,而且每個(gè)節(jié)點(diǎn)安裝目錄要相同.
安裝過(guò)程會(huì)創(chuàng)建OracleMSCSServices,
安裝完成后重新啟動(dòng)系統(tǒng),第一個(gè)節(jié)點(diǎn)就安裝完成了(記住這個(gè)過(guò)程其它節(jié)點(diǎn)是關(guān)閉的哦).
b. 第一個(gè)節(jié)點(diǎn)啟動(dòng)完畢后,這時(shí)可以啟動(dòng)第二個(gè)節(jié)點(diǎn)serverB, 然后在serverB上安裝OFS,記住安裝目錄和第一個(gè)節(jié)點(diǎn)相同.
安裝完后重啟,記得要等到完全啟動(dòng)完畢.
c. 將以前在ServerA上運(yùn)行的數(shù)據(jù)庫(kù)文件(datafile ,control file , online logfile)遷移到共享盤:Q
這個(gè)過(guò)程簡(jiǎn)單,先關(guān)閉并Mount數(shù)據(jù)庫(kù),然后rename來(lái)修改.然后啟動(dòng)數(shù)據(jù)庫(kù),確保正常啟動(dòng).
d. 創(chuàng)建init 文件,密碼文件,傳到第二節(jié)點(diǎn),確保一致.
e. 登入Oracle fail safe Manager, 這里需要登入群集,輸入管理員用戶和密碼即可,根據(jù)向?qū)?yàn)證群集
f.進(jìn)入Fail Safe Manager后,可以看到ServerA節(jié)點(diǎn)下的Standalone Resource下有自己配置的TNSNAMES的名字,
選擇本機(jī)數(shù)據(jù)庫(kù)的那個(gè),點(diǎn)右鍵,并選擇:Verify Standalone Database.
這時(shí),需要輸入數(shù)據(jù)庫(kù)名字
g. 創(chuàng)建OFS的資源組,可以從MSCS那里創(chuàng)建,但推薦就在Fail Safe Manager中創(chuàng)建:
在OFS中,點(diǎn)擊GROUPS,選擇創(chuàng)建資源組,輸入資源組的名稱如:dbresource,選擇Fail back策略.
后續(xù)要給IP地址:192.168.3.103
h. 將數(shù)據(jù)庫(kù)添加到資源組:從當(dāng)前的節(jié)點(diǎn)的Standalone resource中,右鍵點(diǎn)擊數(shù)據(jù)庫(kù),選擇Add Resource to Group,
然后選擇資源類型為: Oracle Database,
資源組為上步創(chuàng)建的資源組,
然后是instance name ,database name
參數(shù)文件: 這里是init文件,不能是SPFILE.
這個(gè)過(guò)程比較長(zhǎng),要?jiǎng)?chuàng)建新的LISTENER.ORA,TNSNAMES.ORA文件,并在第一,第二節(jié)點(diǎn)分別啟動(dòng)(自動(dòng)完成啦)
這時(shí)的監(jiān)聽就變了IP地址了,使用了HAOFS的地址(192.168.3.103),以前配置的連接數(shù)據(jù)庫(kù)的地址需要改變 .
到這里就配置完成了OFS了.可以試著關(guān)閉第一節(jié)點(diǎn),應(yīng)該會(huì)順利的切換到第二節(jié)點(diǎn).