六、配置Nagios
創(chuàng)新互聯(lián)公司為客戶提供專業(yè)的網(wǎng)站建設(shè)、成都做網(wǎng)站、程序、域名、空間一條龍服務(wù),提供基于WEB的系統(tǒng)開發(fā). 服務(wù)項目涵蓋了網(wǎng)頁設(shè)計、網(wǎng)站程序開發(fā)、WEB系統(tǒng)開發(fā)、微信二次開發(fā)、成都做手機網(wǎng)站等網(wǎng)站方面業(yè)務(wù)。
Nagios 主要用于監(jiān)控一臺或者多臺本地主機及遠程的各種信息,包括本機資源及對外的服務(wù)等。默認的Nagios 配置沒有任何監(jiān)控內(nèi)容,僅是一些模板文件。若要讓Nagios 提供服務(wù),就必須修改配置文件,增加要監(jiān)控的主機和服務(wù),下面將詳細介紹。
6.1 默認配置文件介紹
Nagios 安裝完畢后,默認的配置文件在/usr/local/nagios/etc目錄下。
每個文件或目錄含義如下表所示:
文件名或目錄名 | 用途 |
cgi.cfg | 控制CGI訪問的配置文件 |
nagios.cfg | Nagios 主配置文件 |
resource.cfg | 變量定義文件,又稱為資源文件,在些文件中定義變量,以便由其他配置文件引用,如$USER1$ |
objects | objects 是一個目錄,在此目錄下有很多配置文件模板,用于定義Nagios 對象 |
objects/commands.cfg | 命令定義配置文件,其中定義的命令可以被其他配置文件引用 |
objects/contacts.cfg | 定義聯(lián)系人和聯(lián)系人組的配置文件 |
objects/localhost.cfg | 定義監(jiān)控本地主機的配置文件 |
objects/printer.cfg | 定義監(jiān)控打印機的一個配置文件模板,默認沒有啟用此文件 |
objects/switch.cfg | 定義監(jiān)控路由器的一個配置文件模板,默認沒有啟用此文件 |
objects/templates.cfg | 定義主機和服務(wù)的一個模板配置文件,可以在其他配置文件中引用 |
objects/timeperiods.cfg | 定義Nagios 監(jiān)控時間段的配置文件 |
objects/windows.cfg | 監(jiān)控Windows 主機的一個配置文件模板,默認沒有啟用此文件 |
6.2 配置文件之間的關(guān)系
在nagios的配置過程中涉及到的幾個定義有:主機、主機組,服務(wù)、服務(wù)組,聯(lián)系人、聯(lián)系人組,監(jiān)控時間,監(jiān)控命令等,從這些定義可以看出,nagios各個配置文件之間是互為關(guān)聯(lián),彼此引用的。
成功配置出一臺nagios監(jiān)控系統(tǒng),必須要弄清楚每個配置文件之間依賴與被依賴的關(guān)系,最重要的有四點:
第一:定義監(jiān)控哪些主機、主機組、服務(wù)和服務(wù)組;
第二:定義這個監(jiān)控要用什么命令實現(xiàn);
第三:定義監(jiān)控的時間段;
第四:定義主機或服務(wù)出現(xiàn)問題時要通知的聯(lián)系人和聯(lián)系人組。
6.3 配置Nagios
為了能更清楚的說明問題,同時也為了維護方便,建議將nagios各個定義對象創(chuàng)建獨立的配置文件:
創(chuàng)建hosts.cfg文件來定義主機和主機組
創(chuàng)建services.cfg文件來定義服務(wù)
用默認的contacts.cfg文件來定義聯(lián)系人和聯(lián)系人組
用默認的commands.cfg文件來定義命令
用默認的timeperiods.cfg來定義監(jiān)控時間段
用默認的templates.cfg文件作為資源引用文件
a. templates.cfg文件
nagios主要用于監(jiān)控主機資源以及服務(wù),在nagios配置中稱為對象,為了不必重復(fù)定義一些監(jiān)控對象,Nagios引入了一個模板配置文件,將一些共性的屬性定義成模板,以便于多次引用。這就是templates.cfg的作用。
下面詳細介紹下templates.cfg文件中每個參數(shù)的含義:
define contact{ name generic-contact ; 聯(lián)系人名稱 service_notification_period 24x7 ; 當服務(wù)出現(xiàn)異常時,發(fā)送通知的時間段,這個時間段"24x7"在timeperiods.cfg文件中定義 host_notification_period 24x7 ; 當主機出現(xiàn)異常時,發(fā)送通知的時間段,這個時間段"24x7"在timeperiods.cfg文件中定義 service_notification_options w,u,c,r ; 這個定義的是“通知可以被發(fā)出的情況”。w即warn,表示警告狀態(tài),u即unknown,表示不明狀態(tài);
; c即criticle,表示緊急狀態(tài),r即recover,表示恢復(fù)狀態(tài);
; 也就是在服務(wù)出現(xiàn)警告狀態(tài)、未知狀態(tài)、緊急狀態(tài)和重新恢復(fù)狀態(tài)時都發(fā)送通知給使用者。 host_notification_options d,u,r ; 定義主機在什么狀態(tài)下需要發(fā)送通知給使用者,d即down,表示宕機狀態(tài);
; u即unreachable,表示不可到達狀態(tài),r即recovery,表示重新恢復(fù)狀態(tài)。 service_notification_commands notify-service-by-email ; 服務(wù)故障時,發(fā)送通知的方式,可以是郵件和短信,這里發(fā)送的方式是郵件;
; 其中“notify-service-by-email”在commands.cfg文件中定義。 host_notification_commands notify-host-by-email ; 主機故障時,發(fā)送通知的方式,可以是郵件和短信,這里發(fā)送的方式是郵件;
; 其中“notify-host-by-email”在commands.cfg文件中定義。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL CONTACT, JUST A TEMPLATE! }define host{ name generic-host ; 主機名稱,這里的主機名,并不是直接對應(yīng)到真正機器的主機名;
; 乃是對應(yīng)到在主機配置文件里所設(shè)定的主機名。 notifications_enabled 1 ; Host notifications are enabled event_handler_enabled 1 ; Host event handler is enabled flap_detection_enabled 1 ; Flap detection is enabled failure_prediction_enabled 1 ; Failure prediction is enabled process_perf_data 1 ; 其值可以為0或1,其作用為是否啟用Nagios的數(shù)據(jù)輸出功能;
; 如果將此項賦值為1,那么Nagios就會將收集的數(shù)據(jù)寫入某個文件中,以備提取。 retain_status_information 1 ; Retain status information across program restarts retain_nonstatus_information 1 ; Retain non-status information across program restarts notification_period 24x7 ; 指定“發(fā)送通知”的時間段,也就是可以在什么時候發(fā)送通知給使用者。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE! }define host{ name linux-server ; 主機名稱 use generic-host ; use表示引用,也就是將主機generic-host的所有屬性引用到linux-server中來;
; 在nagios配置中,很多情況下會用到引用。 check_period 24x7 ; 這里的check_period告訴nagios檢查主機的時間段 check_interval 5 ; nagios對主機的檢查時間間隔,這里是5分鐘。 retry_interval 1 ; 重試檢查時間間隔,單位是分鐘。 max_check_attempts 10 ; nagios對主機的最大檢查次數(shù),也就是nagios在檢查發(fā)現(xiàn)某主機異常時,并不馬上判斷為異常狀況;
; 而是多試幾次,因為有可能只是一時網(wǎng)絡(luò)太擁擠,或是一些其他原因,讓主機受到了一點影響;
; 這里的10就是最多試10次的意思。 check_command check-host-alive ; 指定檢查主機狀態(tài)的命令,其中“check-host-alive”在commands.cfg文件中定義。 notification_period 24x7 ; 主機故障時,發(fā)送通知的時間范圍,其中“workhours”在timeperiods.cfg中進行了定義;
; 下面會陸續(xù)講到。 notification_interval 10 ; 在主機出現(xiàn)異常后,故障一直沒有解決,nagios再次對使用者發(fā)出通知的時間。單位是分鐘;
; 如果你覺得,所有的事件只需要一次通知就夠了,可以把這里的選項設(shè)為0 notification_options d,u,r ; 定義主機在什么狀態(tài)下可以發(fā)送通知給使用者,d即down,表示宕機狀態(tài);
; u即unreachable,表示不可到達狀態(tài);
; r即recovery,表示重新恢復(fù)狀態(tài)。 contact_groups ts ; 指定聯(lián)系人組,這個“admins”在contacts.cfg文件中定義。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE! }define host{ name windows-server ; The name of this host template use generic-host ; Inherit default values from the generic-host template check_period 24x7 ; By default, Windows servers are monitored round the clock check_interval 5 ; Actively check the server every 5 minutes retry_interval 1 ; Schedule host check retries at 1 minute intervals max_check_attempts 10 ; Check each server 10 times (max) check_command check-host-alive ; Default command to check if servers are "alive" notification_period 24x7 ; Send notification out at any time - day or night notification_interval 10 ; Resend notifications every 30 minutes notification_options d,r ; Only send notifications for specific host states contact_groups ts ; Notifications get sent to the admins by default hostgroups windows-servers ; Host groups that Windows servers should be a member of register 0 ; DONT REGISTER THIS - ITS JUST A TEMPLATE }define service{ name generic-service ; 定義一個服務(wù)名稱 active_checks_enabled 1 ; Active service checks are enabled passive_checks_enabled 1 ; Passive service checks are enabled/accepted parallelize_check 1 ; Active service checks should be parallelized;
; (disabling this can lead to major performance problems) obsess_over_service 1 ; We should obsess over this service (if necessary) check_freshness 0 ; Default is to NOT check service 'freshness' notifications_enabled 1 ; Service notifications are enabled event_handler_enabled 1 ; Service event handler is enabled flap_detection_enabled 1 ; Flap detection is enabled failure_prediction_enabled 1 ; Failure prediction is enabled process_perf_data 1 ; Process performance data retain_status_information 1 ; Retain status information across program restarts retain_nonstatus_information 1 ; Retain non-status information across program restarts is_volatile 0 ; The service is not volatile check_period 24x7 ; 這里的check_period告訴nagios檢查服務(wù)的時間段。 max_check_attempts 3 ; nagios對服務(wù)的最大檢查次數(shù)。 normal_check_interval 5 ; 此選項是用來設(shè)置服務(wù)檢查時間間隔,也就是說,nagios這一次檢查和下一次檢查之間所隔的時間;
; 這里是5分鐘。 retry_check_interval 2 ; 重試檢查時間間隔,單位是分鐘。 contact_groups ts ; 指定聯(lián)系人組 notification_options w,u,c,r ; 這個定義的是“通知可以被發(fā)出的情況”。w即warn,表示警告狀態(tài);
; u即unknown,表示不明狀態(tài);
; c即criticle,表示緊急狀態(tài),r即recover,表示恢復(fù)狀態(tài);
; 也就是在服務(wù)出現(xiàn)警告狀態(tài)、未知狀態(tài)、緊急狀態(tài)和重新恢復(fù)后都發(fā)送通知給使用者。 notification_interval 10 ; Re-notify about service problems every hour notification_period 24x7 ; 指定“發(fā)送通知”的時間段,也就是可以在什么時候發(fā)送通知給使用者。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE! }define service{ name local-service ; The name of this service template use generic-service ; Inherit default values from the generic-service definition max_check_attempts 4 ; Re-check the service up to 4 times in order to determine its final (hard) state normal_check_interval 5 ; Check the service every 5 minutes under normal conditions retry_check_interval 1 ; Re-check the service every minute until a hard state can be determined register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE! }
b. resource.cfg文件
resource.cfg是nagios的變量定義文件,文件內(nèi)容只有一行:
$USER1$=/usr/local/nagios/libexec
其中,變量$USER1$指定了安裝nagios插件的路徑,如果把插件安裝在了其它路徑,只需在這里進行修改即可。需要注意的是,變量必須先定義,然后才能在其它配置文件中進行引用。
c. commands.cfg文件
此文件默認是存在的,無需修改即可使用,當然如果有新的命令需要加入時,在此文件進行添加即可。
#notify-host-by-email命令的定義
define command{ command_name notify-host-by-email #命令名稱,即定義了一個主機異常時發(fā)送郵件的命令。 command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" $CONTACTEMAIL$ #命令具體的執(zhí)行方式。 }#notify-service-by-email命令的定義
define command{ command_name notify-service-by-email #命令名稱,即定義了一個服務(wù)異常時發(fā)送郵件的命令 command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\n\nService: $SERVICEDESC$\nHost: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\n\nDate/Time: $LONGDATETIME$\n\nAdditional Info:\n\n$SERVICEOUTPUT$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Service Alert: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ **" $CONTACTEMAIL$ }
#check-host-alive命令的定義define command{ command_name check-host-alive #命令名稱,用來檢測主機狀態(tài)。 command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5
# 這里的變量$USER1$在resource.cfg文件中進行定義,即$USER1$=/usr/local/nagios/libexec;
# 那么check_ping的完整路徑為/usr/local/nagios/libexec/check_ping;
# “-w 3000.0,80%”中“-w”說明后面的一對值對應(yīng)的是“WARNING”狀態(tài),“80%”是其臨界值。
# “-c 5000.0,100%”中“-c”說明后面的一對值對應(yīng)的是“CRITICAL”,“100%”是其臨界值。
# “-p 1”說明每次探測發(fā)送一個包。
}define command{ command_name check_local_disk command_line $USER1$/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$ #$ARG1$是指在調(diào)用這個命令的時候,命令后面的第一個參數(shù)。 }define command{ command_name check_local_load command_line $USER1$/check_load -w $ARG1$ -c $ARG2$ }define command{ command_name check_local_procs command_line $USER1$/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$ }define command{ command_name check_local_users command_line $USER1$/check_users -w $ARG1$ -c $ARG2$ }define command{ command_name check_local_swap command_line $USER1$/check_swap -w $ARG1$ -c $ARG2$ }define command{ command_name check_ftp command_line $USER1$/check_ftp -H $HOSTADDRESS$ $ARG1$ }define command{ command_name check_http command_line $USER1$/check_http -I $HOSTADDRESS$ $ARG1$ }define command{ command_name check_ssh command_line $USER1$/check_ssh $ARG1$ $HOSTADDRESS$ }define command{ command_name check_ping command_line $USER1$/check_ping -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 5 }define command{ command_name check_nt command_line $USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -v $ARG1$ $ARG2$ }
d. hosts.cfg文件
此文件默認不存在,需要手動創(chuàng)建,hosts.cfg主要用來指定被監(jiān)控的主機地址以及相關(guān)屬性信息,根據(jù)實驗?zāi)繕伺渲萌缦拢?/p>
define host{ use linux-server #引用主機linux-server的屬性信息,linux-server主機在templates.cfg文件中進行了定義。 host_name Nagios-Linux #主機名 alias Nagios-Linux #主機別名 address 192.168.1.111 #被監(jiān)控的主機地址,這個地址可以是ip,也可以是域名。 }
#定義一個主機組 define hostgroup{ hostgroup_name bsmart-servers #主機組名稱,可以隨意指定。 alias bsmart servers #主機組別名 members Nagios-Linux #主機組成員,其中“Nagios-Linux”就是上面定義的主機。
}
注意:在/usr/local/nagios/etc/objects 下默認有l(wèi)ocalhost.cfg 和windows.cfg 這兩個配置文件,localhost.cfg 文件是定義監(jiān)控主機本身的,windows.cfg 文件是定義windows 主機的,其中包括了對host 和相關(guān)services 的定義。所以在本次實驗中,將直接在localhost.cfg 中定義監(jiān)控主機(Nagios-Server),在windows.cfg中定義windows 主機(Nagios-Windows)。根據(jù)自己的需要修改其中的相關(guān)配置,詳細如下:
localhost.cfg
define host{ use linux-server ; Name of host template to use ; This host definition will inherit all variables that are defined ; in (or inherited by) the linux-server host template definition. host_name Nagios-Server alias Nagios-Server address 127.0.0.1 }define hostgroup{ hostgroup_name linux-servers ; The name of the hostgroup alias Linux Servers ; Long name of the group members Nagios-Server ; Comma separated list of hosts that belong to this group }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description PING check_command check_ping!100.0,20%!500.0,60% }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Root Partition check_command check_local_disk!20%!10%!/ }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Current Users check_command check_local_users!20!50 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Total Processes check_command check_local_procs!250!400!RSZDT }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Current Load check_command check_local_load!5.0,4.0,3.0!10.0,6.0,4.0 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Swap Usage check_command check_local_swap!20!10 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description SSH check_command check_ssh notifications_enabled 0 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description HTTP check_command check_http notifications_enabled 0 }
windows.cfg
define host{ use windows-server ; Inherit default values from a template host_name Nagios-Windows ; The name we're giving to this host alias My Windows Server ; A longer name associated with the host address 192.168.1.113 ; IP address of the host }define hostgroup{ hostgroup_name windows-servers ; The name of the hostgroup alias Windows Servers ; Long name of the group }define service{ use generic-service host_name Nagios-Windows service_description NSClient++ Version check_command check_nt!CLIENTVERSION }define service{ use generic-service host_name Nagios-Windows service_description Uptime check_command check_nt!UPTIME }define service{ use generic-service host_name Nagios-Windows service_description CPU Load check_command check_nt!CPULOAD!-l 5,80,90 }define service{ use generic-service host_name Nagios-Windows service_description Memory Usage check_command check_nt!MEMUSE!-w 80 -c 90 }define service{ use generic-service host_name Nagios-Windows service_description C:\ Drive Space check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90 }define service{ use generic-service host_name Nagios-Windows service_description W3SVC check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC }define service{ use generic-service host_name Nagios-Windows service_description Explorer check_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe }
e.services.cfg文件
此文件默認也不存在,需要手動創(chuàng)建,services.cfg文件主要用于定義監(jiān)控的服務(wù)和主機資源,例如監(jiān)控http服務(wù)、ftp服務(wù)、主機磁盤空間、主機系統(tǒng)負載等等。Nagios-Server 和Nagios-Windows 相關(guān)服務(wù)已在相應(yīng)的配置文件中定義,所以這里只需要定義Nagios-Linux 相關(guān)服務(wù)即可,這里只定義一個檢測是否存活的服務(wù)來驗證配置文件的正確性,其他服務(wù)的定義將在后面講到。
define service{ use local-service #引用local-service服務(wù)的屬性值,local-service在templates.cfg文件中進行了定義。 host_name Nagios-Linux #指定要監(jiān)控哪個主機上的服務(wù),“Nagios-Server”在hosts.cfg文件中進行了定義。 service_description check-host-alive #對監(jiān)控服務(wù)內(nèi)容的描述,以供維護人員參考。 check_command check-host-alive #指定檢查的命令。
}
f. contacts.cfg文件
contacts.cfg是一個定義聯(lián)系人和聯(lián)系人組的配置文件,當監(jiān)控的主機或者服務(wù)出現(xiàn)故障,nagios會通過指定的通知方式(郵件或者短信)將信息發(fā)給這里指定的聯(lián)系人或者使用者。
define contact{ contact_name David #聯(lián)系人的名稱,這個地方不要有空格 use generic-contact #引用generic-contact的屬性信息,其中“generic-contact”在templates.cfg文件中進行定義 alias Nagios Admin email david.tang@bsmart.cn }
define contactgroup{ contactgroup_name ts #聯(lián)系人組的名稱,同樣不能空格 alias Technical Support #聯(lián)系人組描述 members David #聯(lián)系人組成員,其中“david”就是上面定義的聯(lián)系人,如果有多個聯(lián)系人則以逗號相隔 }
g. timeperiods.cfg文件
此文件只要用于定義監(jiān)控的時間段,下面是一個配置好的實例:
#下面是定義一個名為24x7的時間段,即監(jiān)控所有時間段 define timeperiod{ timeperiod_name 24x7 #時間段的名稱,這個地方不要有空格 alias 24 Hours A Day, 7 Days A Week sunday 00:00-24:00 monday 00:00-24:00 tuesday 00:00-24:00 wednesday 00:00-24:00 thursday 00:00-24:00 friday 00:00-24:00 saturday 00:00-24:00 } #下面是定義一個名為workhours的時間段,即工作時間段。 define timeperiod{ timeperiod_name workhours alias Normal Work Hours monday 09:00-17:00 tuesday 09:00-17:00 wednesday 09:00-17:00 thursday 09:00-17:00 friday 09:00-17:00 }
h. cgi.cfg文件
此文件用來控制相關(guān)cgi腳本,如果想在nagios的web監(jiān)控界面執(zhí)行cgi腳本,例如重啟nagios進程、關(guān)閉nagios通知、停止nagios主機檢測等,這時就需要配置cgi.cfg文件了。
由于nagios的web監(jiān)控界面驗證用戶為david,所以只需在cgi.cfg文件中添加此用戶的執(zhí)行權(quán)限就可以了,需要修改的配置信息如下:
default_user_name=davidauthorized_for_system_information=nagiosadmin,david authorized_for_configuration_information=nagiosadmin,david authorized_for_system_commands=davidauthorized_for_all_services=nagiosadmin,david authorized_for_all_hosts=nagiosadmin,davidauthorized_for_all_service_commands=nagiosadmin,david authorized_for_all_host_commands=nagiosadmin,david
i. nagios.cfg文件
nagios.cfg默認的路徑為/usr/local/nagios/etc/nagios.cfg,是nagios的核心配置文件,所有的對象配置文件都必須在這個文件中進行定義才能發(fā)揮其作用,這里只需將對象配置文件在Nagios.cfg文件中進行引用即可。
log_file=/usr/local/nagios/var/nagios.log # 定義nagios日志文件的路徑cfg_file=/usr/local/nagios/etc/objects/commands.cfg # “cfg_file”變量用來引用對象配置文件,如果有更多的對象配置文件,在這里依次添加即可。
cfg_file=/usr/local/nagios/etc/objects/contacts.cfg
cfg_file=/usr/local/nagios/etc/objects/hosts.cfg
cfg_file=/usr/local/nagios/etc/objects/services.cfg
cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfgcfg_file=/usr/local/nagios/etc/objects/templates.cfg
cfg_file=/usr/local/nagios/etc/objects/localhost.cfg # 本機配置文件
cfg_file=/usr/local/nagios/etc/objects/windows.cfg # windows 主機配置文件object_cache_file=/usr/local/nagios/var/objects.cache # 該變量用于指定一個“所有對象配置文件”的副本文件,或者叫對象緩沖文件precached_object_file=/usr/local/nagios/var/objects.precache
resource_file=/usr/local/nagios/etc/resource.cfg # 該變量用于指定nagios資源文件的路徑,可以在nagios.cfg中定義多個資源文件。status_file=/usr/local/nagios/var/status.dat # 該變量用于定義一個狀態(tài)文件,此文件用于保存nagios的當前狀態(tài)、注釋和宕機信息等。status_update_interval=10 # 該變量用于定義狀態(tài)文件(即status.dat)的更新時間間隔,單位是秒,最小更新間隔是1秒。nagios_user=nagios # 該變量指定了Nagios進程使用哪個用戶運行。
nagios_group=nagios # 該變量用于指定Nagios使用哪個用戶組運行。check_external_commands=1 # 該變量用于設(shè)置是否允許nagios在web監(jiān)控界面運行cgi命令;
# 也就是是否允許nagios在web界面下執(zhí)行重啟nagios、停止主機/服務(wù)檢查等操作;
# “1”為運行,“0”為不允許。command_check_interval=10s # 該變量用于設(shè)置nagios對外部命令檢測的時間間隔,如果指定了一個數(shù)字加一個"s"(如10s);
# 那么外部檢測命令的間隔是這個數(shù)值以秒為單位的時間間隔;
# 如果沒有用"s",那么外部檢測命令的間隔是以這個數(shù)值的“時間單位”的時間間隔。
interval_length=60 # 該變量指定了nagios的時間單位,默認值是60秒,也就是1分鐘;
# 即在nagios配置中所有的時間單位都是分鐘。
6.4 驗證Nagios 配置文件的正確性
Nagios 在驗證配置文件方面做的非常到位,只需通過一個命令即可完成:
# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
看到上面這些信息就說明沒問題了,然后啟動Nagios 服務(wù)。
7.1 啟動Nagios
a. 通過初始化腳本啟動nagios
# /etc/init.d/nagios start
or
# service nagios start
b. 手工方式啟動nagios
# /usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg
7.2 重啟Nagios
當修改了配置文件讓其生效時,需要重啟/重載Nagios服務(wù)。
a. 通過初始化腳本來重啟nagios
# /etc/init.d/nagios reload
or
# /etc/init.d/nagios restart
or
# service nagios restart
b. 通過web監(jiān)控頁重啟nagios
可以通過web監(jiān)控頁的 "Process Info" -> "Restart the Nagios process"來重啟nagios
c. 手工方式平滑重啟
# kill -HUP <nagios_pid>
7.3 停止Nagios
a. 通過初始化腳本關(guān)閉nagios服務(wù)
# /etc/init.d/nagios stop
or
# service nagios stop
b. 通過web監(jiān)控頁停止nagios
可以通過web監(jiān)控頁的 "Process Info" -> "Shutdown the Nagios process"來停止nagios
c. 手工方式停止Nagios
# kill <nagios_pid>
網(wǎng)站名稱:nagios部署安裝中篇
標題路徑:http://aaarwkj.com/article38/pegepp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗、商城網(wǎng)站、面包屑導航、網(wǎng)站建設(shè)、App開發(fā)、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)