业务反馈突然连接不上phxsql,没有权限,发现phxsql的17000端口挂掉了,也就是phxbinlogsrv进程挂掉

root12304110May13?00:00:00sh/data1/phxsql/bin/mysqld_safe--defaults-file=/data1/phxsql/etc/my.cnf--super_read_only--plugin-load=phxsync_master_phxrpc.soroot12305219May13?13:07:09/data1/phxsql/sbin/phxsqlproxy_phxrpc/data1/phxsql/etc/phxsqlproxy.confdaemonroot12305419May13?13:08:06/data1/phxsql/sbin/phxsqlproxy_phxrpc/data1/phxsql/etc/phxsqlproxy.confdaemonmysql1244321230410May13?00:13:30/data1/phxsql/sbin/mysqld--defaults-file=/data1/phxsql/etc/my.cnf--basedir=/data1/phxsql/percona.src--datadir=/data1/tmp/percona.workspace/data--plugin-dir=/data1/phxsql/lib--user=mysql--super-read-only--plugin-load=phxsync_master_phxrpc.so--log-error=/data1/tmp/percona.workspace/log.err--pid-file=/data1/tmp/percona.workspace/data/percona.pid--socket=/data1/tmp/percona.workspace/tmp/percona.sock--port=11111

在网上查到这是phxsql的一个bug,https://github.com/tencent-wechat/phxsql/issues/89


解决方案是增加从库的网络timeout时间,另外在my.cnf上也加入这个参数,重新启动phxbinlogsrv模块即可

showvariableslike'slave_net_timeout';setglobalslave_net_timeout=31536000;