nrpe详解

2024-11-19 技术教程

Nrpe详解1.先用表格列举一下我的监控对象和阀值：

监控对象监控阀值主机资源主机存活：check_ping-w 3000.0,80% -c 5000.0,100% -p 5(3000毫秒响应时间内，丢包率超过80%报警告，5000毫秒响应时间内，丢包率超过100%报危急，一共发送5个包）登录用户：check_user-w 5 -c 10(w为警告，c为危急)系统负载：check_load-w 15,10,5 -c 30,25,20(1分钟，5分钟，15分钟大于对应的等待进程数则警告或危急)磁盘占用率：check_disk-w 20% -c 10% -p /（根分区剩余空间为总大小的20%警告，10%危急，-p后是根分区）脚本检测磁盘I/O：check_iostat-w 5 –c 10 (磁盘I/O的iowait超过5%报警告,超过10%报危急)检测僵尸进程：check_zombie _procs-w 5 -c 10 -s Z（有5个僵尸进程报警告，10个报危急）检测总进程数：check_total_procs-w 150 -c 200（总进程到150个警告，200个报危急）脚本检测内存剩余：check_mem-w 90% -c 95%(内存空闲率90%以上报警告，95%以上报危急)检测交换分区使用率：check_swap-w 20% -c 10%（交换分区剩余空间为总大小的20%警告，10%危急）应用服务监控监控服务端口：check_tcp-H localhost2 -p 80(主机与对应的端口号)监控页面响应时间：check_http-H localhost2 -u http:\/\/localhost2/test.jsp –w 5 –c 10(检查页面，超过5s报警告，超过10s报危急)脚本检测IP连接数：check_ips-w 200 –c 250(IP连接数超过200报警告，超过250报危急)流量监控监控server流量:Check_traffic
-V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b(snmp版本,用户,主机,对应网卡,警告阀值,危急阀值)

command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Zcommand[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /command[check_ips]=/usr/local/nagios/libexec/ip_conn.sh 200 250command[check_mem]=/usr/local/nagios/libexec/check_mem.sh -w 90% -c 95%command[check_iostat]=/usr/local/nagios/libexec/check_iostat -w 5 -c 10command[check_traffic]=/usr/local/nagios/libexec/check_traffic.sh -V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。