zabbix通过curl命令判断web服务是否正常并自动重启服务
主要思路: 通过curl命令获取服务器响应码,如果正常返回200,不正常返回000 具体命令: curl -I -s -w "%{http_code}" -o /dev/null http://www.baidu.com/ 1.编辑zabbix-agent客户端的配置文件 ①vim /etc/zabbix/zabbix_agentd.conf # 添加命令参数 UserParameter=script_status,/usr/bin/curl -I -s -w "%{http_code}" -o /dev/null http://1.1.1.1:9735/check # 打开远程命令调用 EnableRemoteCommands = 1 重启服务生效 service zabbix-agent restart ②visudo打开关于zabbix操作的命令 a. 添加zabbix权限 zabbix ALL=(ALL) NOPASSWD: ALL b.注释掉如下一行,否则命令无法执行: # Default requiretty 2.添加需要被触发的脚本 vim /usr/local/zabbix-agent/scripts/restart_script.sh#!/bin/bash# killyunva-script 关闭yunva-script这个java进程ps -ef|grep yunva-script-1.0.0.jar|/bin/kill `awk '{print $2}'`sleep 3# start yunva-script 重新启动yunva-script这个java脚本cd /home/script/ && /bin/bash start.sh startchmod +x /usr/local/zabbix-agent/scripts/restart_script.sh-------------------------------------- start.sh脚本内容:
#!/bin/bashLANG="zh_CN.UTF-8"APP_HOME=$(echo `pwd` | sed 's/bin//')APPPIDFILE=$APP_HOME/app.pidcase $1 instart) echo "Starting server... " HEAP_MEMORY=1024m PERM_MEMORY=64m JMX_PORT=8911 JMX_HOST=1.1.1.1 JAVA_OPTS="-server -Djava.nio.channels.spi.SelectorProvider=sun.nio.ch.EPollSelectorProvider -XX:+HeapDumpOnOutOfMemoryError -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false -Dio.netty.leakDetectionLevel=advanced" shift ARGS=($*) for ((i=0; i<${#ARGS[@]}; i++)); do case "${ARGS[$i]}" in -D*) JAVA_OPTS="${JAVA_OPTS} ${ARGS[$i]}" ;; -Heap*) HEAP_MEMORY="${ARGS[$i+1]}" ;; -Perm*) PERM_MEMORY="${ARGS[$i+1]}" ;; -JmxPort*) JMX_PORT="${ARGS[$i+1]}" ;; -JmxHost*) JMX_HOST = "${ARGS[$i+1]}" ;; esac done JAVA_OPTS="${JAVA_OPTS} -Xms${HEAP_MEMORY} -Xmx${HEAP_MEMORY} -XX:PermSize=${PERM_MEMORY} -XX:MaxPermSize=${PERM_MEMORY} -Dcom.sun.management.jmxremote.port=${JMX_PORT} -Djava.rmi.server.hostname=${JMX_HOST} -Dapp.home=${APP_HOME}" echo "start jvm args ${JAVA_OPTS}" nohup /home/java/jdk1.8.0_40/bin/java -classpath .:./yunva-script-1.0.0.jar:$CLASSPATH $JAVA_OPTS com.yunva.script.ScriptServer& echo $! > $APPPIDFILE echo STARTED ;;stop) echo "Stopping server ... " if [ ! -f $APPPIDFILE ] then echo "error: count not find file $APPPIDFILE" exit 1 else kill -15 $(cat $APPPIDFILE) rm $APPPIDFILE echo STOPPED fi ;;*) echo "Please enter start|stop ... " ;;esacexit 0-------------------------------------- 3.zabbix-server的web配置 测试远程命令是否ok # zabbix_get -s 1.1.1.1 -p 10050 -k script_status 200 ①添加监控项item Confuguration --> Hosts --> 找到对应的主机,点开 Items --> Create item Name: script_check # key需要和zabbix-agentd.conf中定义的Parameter参数一致 Key: script_status ②创建对该监控项的触发器 Confuguration --> Hosts --> 找到对应的主机,点开 Triggers --> Create trigger Name: yunva_scripts_port_9735_not_200 Expression: {iZ23xtdqvgmZ:script_status.last()}<>200 ③设置Action Configuration-->Actions-->Create action 创建Action动作,即返回值不是200的时候重启服务 在Action选项中, 定义Name:yunva_scripts_port_9735_not_200 #action name自定义即可,action选项的其余部分可采用默认值,如下: Conditions 在Conditions选项中添加新的条件判断,以使判断更有针对性,如 New condition:Trigger severity = Warning New condition:Trigger name like yunva_scripts_port_9735_not_200 #trigger name对应步骤1中定义的trigger name,如下: Operations 在Operations选项中,添加新的”Action operation”,点击”New”, Operation type:选择”Remote Command” Target list:添加target为”Current host” #agent在本机 Type:选择”Custom script” Execute on:选择”Zabbix agent”,命令为 "sudo /bin/bash /usr/local/zabbix-agent/scripts/restart_script.sh"
以上的方法实践证明不是很可靠,如果服务宕掉,可以出发事件,http服务如果超出一定时间不响应,使用curl命令无法判断到底是否触发,如果超过了10秒以上,我们可以认为服务已经不可用(没有用户可以忍受10秒以上的页面响应速度),通过web的方式可以做到,具体实现方法可以参考 :http://blog.csdn.net/reblue520/article/details/52312164