nagios监控Linux服务器的过程如下:
客户配置:
建用户:
useradd nagios (可以在 /etc/password 修改此帐户shell为 /sbin/nologin)
passwd nagios
安装插件:
修改权限:
chown nagios:nagios /usr/local/nagios –R
安装Nrpe服务:
添加服务器IP:
vi /etc/xinetd.d/nrpe
only_from = 127.0.0.1 192.168.0.108
添加 nrpe 服务:
vi /etc/services
Nrpe 5666/tcp # nrpe
重新启动Xinetd服务:
service xinetd restart
查看Nrpe服务是否开放:
netstat -ant|grep 5666
测试Nrpe能否正常工作:
/usr/local/nagios/libexec/check_nrpe -H localhost
NRPE v2.8.1 (这意味着在本地使用check_nrpe连接nrpe daemon是正常的)
服务端配置:
A 拷贝 localhost.cfg 模板文件,对192.168.112.101进行监控:
cp /usr/local/nagios/etc/localhost.cfg /usr/local/nagios/etc/192.168.112.101.cfg
vi 192.168.112.101.cfg
修改配置(主机名,IP、别名)
B 将192.168.112.101.cfg 加入nagios 主配置文件:
vi /usr/local/nagios/etc/nagios.cfg
cfg_file=/usr/local/nagios/etc/objects/192.168.112.101.cfg
C 验证配置文件是否正确并重启:
/usr/local/nagios/bin/nagios –v /usr/local/nagios/etc/object/nagios.cfg
Service nagios restart (重启nagios 使配置生效)
D 查看naigios监控页面发现主机已正常添加。
在服务端增加监控服务(不必要):
在Command.cfg文件中增加check_nrpe的功能:
注意:-c后面带的$ARG1$参数是传给nrpe daemon执行的检测命令,在services.cfg中使用check_nrpe使用时间!带上这个参数。
额外知识点:
vi /usr/local/nagios/etc/nrpe.cfg
找到以下内容:
[] 是命令名,即命令名check_nrpe 的-c可以连接参数的内容,=后面是实际执行的插件程序commands.cfg定义命令的形式非常相似,只是写在一行.也就是说check_users等号后面/是等号后面/usr/local/nagios/libexec/check_users -w 5 -c 10的简称.
很容易知道上述五行定义的命令是检测登录用户的数量,cpu负载,hda1容量,僵尸过程,总过程数.用法: ./check_load --help,由于-c后面只能接nrpe.cfg定义的命令,也就是说,我们现在只能使用上面定义的五个命令。
nagios请读者阅读其他配置:
安装配置nagios、修改Apache配置、Nagios 3.0配置和监控的初步安装Windows十个服务器Nagios故障解决技巧