中午刚吃完饭,boss就截图过来,:“看看这几个监控项怎么回事”


登陆到监控机,手动执行插件。出现和web页面一致的报错。这个监控早就布置好,应该不会有问题。查看插件的-h帮助,监控机的语法也没有问题。恰好自己测试机中也有一台同样系统版本的服务器。执行插件没有问题。想着把测试机中的插件上传到服务器。设置好插件的权限后,执行插件后又有了新的报错。

请教公司大神。告诉我,重新编译安装下nagios-plugins。加入

--with-ps-command="/bin/pslaxnwww"选项.看了看。check_procs估计是基于系统的ps命令来检测服务器的进程。默认编译的时候PS_COMMAND选项是 “/bin/ps -axwo......”具体可以看编译后的config.status文件。少了多了个“-”,手动执行ps的时候,“ps -aux"也可以看见这个warnning! 然而,然并卵,加入参数编译后服务器PS_COMMAND编译结果依然带"-"。无奈。下班了。。。。。

回到家。×××。。。。坑爹的百度。终于找到了完整的答案。

./configure --enable-extra-opts=yes --with-ps-command="/bin/ps laxnwww" --with-ps-format="%s %d %d %d %d %d %f %s %n" --with-ps-cols=9 --with-ps-varlist="procstat,&procuid,&procpid,&procppid,&procvsz,&procrss,&procpcpu,procprog,&pos"

标红那个大概意思是“启用扩展的选项”好吧。原来还有个开关。。。。这次安装好后,warnning没有了。但是。。。截图过来的那个报错又出现了。。unsupoort options。。。。

最后一招。升级nagios-plugins。同时编译过程中指定ps的格式。。

finally 大功告成!