2.2 nagios 监控客户端
配置客户端
安装 epel 扩展源
[root@localhost~]#yuminstall-yepel-release
安装 nagios 以及 nagios-plugins
[root@localhost~]#yuminstall-ynagios-pluginsnagios-plugins-allnrpenagios-plugins-nrpe
编辑配置文件
[root@localhost~]#vim/etc/nagios/nrpe.cfg
找到“allowed_hosts=127.0.0.1”改为“allowed_hosts=127.0.0.1,192.168.56.133”后面的ip为服务端ip
找到“dont_blame_nrpe=0”改为“dont_blame_nrpe=1”
allowed_hosts=127.0.0.1,192.168.56.133dont_blame_nrpe=1
启动客户端
[root@localhost~]#/etc/init.d/nrpestartStartingnrpe:[确定]
服务端配置:(!!!服务端操作)
客户端ip为192.168.56.128,下面定义子配置文件。
[root@localhost~]#cd/etc/nagios/conf.d/[root@localhostconf.d]#vim192.168.56.128.cfgdefinehost{uselinux-serverhost_name192.168.56.128alias56.128address192.168.56.128}defineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_pingcheck_commandcheck_ping!100.0,20%!200.0,50%max_check_attempts5normal_check_interval1}defineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_sshcheck_commandcheck_sshmax_check_attempts5normal_check_interval1notification_interval60}defineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_httpcheck_commandcheck_httpmax_check_attempts5normal_check_interval1}
说明:“max_check_attempts 5”表示,当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题就立即告警。“normal_check_interval 1”表示,重新检测的时间间隔,单位是分钟,默认是3分钟。“notification_interval 60”表示,在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间,单位是分钟。如果认为所有的事件只需要一次通知就够了,可以把这里的选项设为0。
以上服务不依赖客户端nrpe服务,比如我们在自己电脑上可以使用ping或者telnet探测远程任何一台机器是否存活、是否开启某个端口或服务。而当检测客户端上的某个具体服务的情况时,就需要借助于nrpe了,比如想知道客户端机器的负载或磁盘使用情况。
编辑完配置文件后,在服务端重启一下nagios服务。
[root@localhostconf.d]#servicenagiosrestartRunningconfigurationcheck...done.Stoppingnagios:.done.Startingnagios:done.
然后在浏览器中访问nagios,刷新会多出来一个主机,并且多出来三个服务。
只不过这三个服务并不是我们想要的,我想要监控负载和磁盘使用率等服务,这时候就要使用nrpe服务了。继续在服务端添加服务。
(!!!服务端操作)
编辑配置文件
[root@localhost~]#vim/etc/nagios/objects/commands.cfg
增加:
definecommand{command_namecheck_nrpecommand_line$USER1$/check_nrpe-H$HOSTADDRESS$-c$ARG1$}
继续编辑
[root@localhost~]#vim/etc/nagios/conf.d/192.168.56.128.cfgdefineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_loadcheck_commandcheck_nrpe!check_loadmax_check_attempts5normal_check_interval1}defineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_disk_hda1check_commandcheck_nrpe!check_hda1max_check_attempts5normal_check_interval1}defineservice{usegeneric-servicehost_name192.168.56.128service_descriptioncheck_disk_hda2check_commandcheck_nrpe!check_hda2max_check_attempts5normal_check_interval1}
说明:“check_nrpe!check_load”这里的check_nrpe就是在commands.cfg刚刚定义的,check_load是远程主机上的一个检测脚本。
(!!!以下客户端操作)
在远程主机上编辑 nrpe.cfg 配置文件
[root@localhost~]#vim/etc/nagios/nrpe.cfg
找到 check_load 这一行,这行就是在客户端上要执行的脚本。然后把 check_hda1 更改一下:/dev/hda1 改为 /dev/sda1。再加一行检测sda2的语句。
command[check_load]=/usr/lib64/nagios/plugins/check_load-w15,10,5-c30,25,20command[check_hda1]=/usr/lib64/nagios/plugins/check_disk-w20%-c10%-p/dev/sda1command[check_hda2]=/usr/lib64/nagios/plugins/check_disk-w20%-c10%-p/dev/sda2
客户端重启 nrpe 服务
[root@localhost~]#servicenrperestartShuttingdownnrpe:[确定]Startingnrpe:[确定]
服务端重启 nagios 服务
[root@localhost~]#servicenagiosrestartRunningconfigurationcheck...done.Stoppingnagios:done.Startingnagios:done.
浏览器刷新,又有三个服务出来,稍等一会儿就能看到状态了。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。