一、NSclient++與nrpe
nagios對(duì)windows的監(jiān)控主要有兩種方法,一種是NSclient++,另一種是通過nrpe的方式來達(dá)到監(jiān)控目的
NSclient++與nrpe最大的區(qū)別就是:
1、被監(jiān)控機(jī)上安裝有nrpe,并且還有插件,最終的監(jiān)控是由這些插件來進(jìn)行的.當(dāng)監(jiān)控主機(jī)將監(jiān)控請(qǐng)求發(fā)給nrpe后,nrpe調(diào)用插件來完成監(jiān)控.
2、NSclient++則不同,被監(jiān)控機(jī)上只安裝NSclient++,沒有任何的插件.當(dāng)監(jiān)控主機(jī)將監(jiān)控請(qǐng)求發(fā)給NSclient++后,NSclient++直接完成監(jiān)控,所有的監(jiān)控是由NSclient++完成的。
這也說明了NSclient++的一個(gè)很大的問題,不靈活,沒有可擴(kuò)展性.它只能完成自己本身包含的監(jiān)控操作,不能由一些插件來擴(kuò)展.好在NSclient++已經(jīng)做的不錯(cuò)了,基本上可以完全滿足我們的監(jiān)控需要。
NSclient++的原理圖
二、部署過程
1、在windows上安裝NSclient++
(1)一直下一步
(2)設(shè)置nagios服務(wù)器IP地址
(3)檢查NSclient++的端口是否成功開啟
如果服務(wù)沒有開啟,就:win+r --> services.msc --> nsclient++ 開啟服務(wù)即可
(4)防火墻打開tcp 12489端口
(5)設(shè)置服務(wù)自啟動(dòng)
2、設(shè)置nagios服務(wù)器
(1)檢測(cè)nagios命令是否可以正常監(jiān)測(cè)windows主機(jī)
(2)定義命令、主機(jī)、服務(wù)
①、定義命令
②、定義主機(jī)和服務(wù)
為了方便,主機(jī)和監(jiān)控服務(wù)都定義在一個(gè)配置文件里面
首先創(chuàng)在/usr/local/nagios/etc建一個(gè)文件夾servers專門保存各服務(wù)器的配置文件,然后以服務(wù)器IP命名各服務(wù)器配置文件
這樣的話,nagios.cfg里面就需要開啟對(duì)servers目錄的支持
(3)檢查配置文件有無錯(cuò)誤
如果沒有消息,那就是最好的消息,下一步,就可以重啟nagios服務(wù)了
(4)重啟nagios服務(wù)
三、nagios監(jiān)控頁面查看主機(jī)與服務(wù)
1、主機(jī)狀態(tài)
2、服務(wù)狀態(tài)
四、排錯(cuò)階段
本次部署nagios監(jiān)控windows主機(jī)主要碰到兩個(gè)問題
1、主機(jī)狀態(tài)(status)是down,而不是正常的up
原因:這種情況下,一般都是服務(wù)器禁ping了,監(jiān)控服務(wù)器是通過ping服務(wù)來檢查被監(jiān)控服務(wù)器是否在線,當(dāng)把windows服務(wù)器ping的回顯請(qǐng)求開啟后,監(jiān)控成功
解決:win2008:服務(wù)器管理器——設(shè)置——高級(jí)安全windows防火墻——入站規(guī)則——找到“文件和打印機(jī)共享(回顯請(qǐng)求-ICMPv4-in)”右擊……選擇“啟用規(guī)則”
2、could not fetch information from server
當(dāng)把第1個(gè)問題解決掉后,Status是UP起來了,可是所有的服務(wù)全部都是could not fetch information from server
原因:出現(xiàn)這種狀況的原因是因?yàn)閚agios服務(wù)器沒有從被監(jiān)控端服務(wù)器上獲得相關(guān)數(shù)據(jù),直接原因就是NSclient++的配置文件中Allowed hosts的IP沒有設(shè)置正確
解決:NSclient++的配置文件中 Allowed hosts = nagios服務(wù)器IP
當(dāng)時(shí)在安裝NSclient++時(shí),我的 Allowed hosts = 192.168.200.105 ,我的設(shè)置是正確的,但是為什么會(huì)變成15我也不知道為什么
聯(lián)系客服