mysql主从复制与数据同步Slave_IO_Running错误

主从复制就是对主站服务器的mysql数据库进行实时的备份了,我们只要是简单的做一下配置就可以了,但在配置中也碰到一些问题,下面一起来看看.

mysql主从复制,怎么安装mysql数据库,这里不说了,只说它的主从复制,步骤如下:

1、主从服务器分别作以下操作:

1.1、版本一致

1.2、初始化表,并在后台启动mysql

1.3、修改root的密码

2、修改主服务器master:

#vi/etc/my.cnf
[mysqld]
log-bin=mysql-bin//[必须]启用二进制日志
server-id=108//[必须]服务器唯一ID，默认是1，一般取IP最后一段

3、修改从服务器slave:

#vi/etc/my.cnf
[mysqld]
log-bin=mysql-bin//[必须]启用二进制日志
server-id=3//[必须]服务器唯一ID，默认是1，一般取IP最后一段

4、重启两台服务器的mysql

/etc/init.d/mysql restart

5、在主服务器上建立帐户并授权slave:

#/usr/local/mysql/bin/mysql -uroot -pmttang

mysql>GRANT REPLICATION SLAVE ON *.* to 'mysync'@'%' identified by 'q123456'; //一般不用root帐号，“%”表示所有客户端都可能连，只要帐号，密码正确，此处可用具体客户端IP代替，如192.168.1.3，加强安全。

6、登录主服务器的mysql,查询master的状态:

mysql>showmasterstatus;
+------------------+----------+--------------+------------------+
|File|Position|Binlog_Do_DB|Binlog_Ignore_DB|
+------------------+----------+--------------+------------------+
|mysql-bin.000001|251|||
+------------------+----------+--------------+------------------+
1rowinset(0.00sec)

注:执行完此步骤后不要再操作主服务器MYSQL,防止主服务器状态值变化

7、配置从服务器Slave:

mysql>changemastertoaster_host='192.168.145.222',master_user='mysync',master_password='q123456',
master_log_file='mysql-bin.000001',master_log_pos=251;//注意不要断开，“251”无单引号。
Mysql>startslave;//启动从服务器复制功能

8、检查从服务器复制功能状态:

mysql>showslavestatusG
***************************1.row***************************
Slave_IO_State:Waitingformastertosendevent
Master_Host:192.168.2.222//主服务器地址
Master_User:mysync//授权帐户名，尽量避免使用root
Master_Port:3306//数据库端口，部分版本没有此行
Connect_Retry:60
Master_Log_File:mysql-bin.000001
Read_Master_Log_Pos:600//#同步读取二进制日志的位置，大于等于>=Exec_Master_Log_Pos
Relay_Log_File:ddte-relay-bin.000003
Relay_Log_Pos:251
Relay_Master_Log_File:mysql-bin.000001
Slave_IO_Running:Yes//此状态必须YES
Slave_SQL_Running:Yes//此状态必须YES
......

注:Slave_IO及Slave_SQL进程必须正常运行,即YES状态,否则都是错误的状态,如:其中一个NO均属错误,错误解答.以上操作过程,主从服务器配置完成.

9、主从服务器测试:

主服务器Mysql,建立数据库,并在这个库中建表插入一条数据,代码如下:

mysql>createdatabasehi_db;
QueryOK,1rowaffected(0.00sec)
mysql>usehi_db;
Databasechanged
mysql>createtablehi_tb(idint(3),namechar(10));
QueryOK,0rowsaffected(0.00sec)
mysql>insertintohi_tbvalues(001,'wf');
QueryOK,1rowaffected(0.00sec)
mysql>showdatabases;
+--------------------+
|Database|
+--------------------+
|information_schema|
|hi_db|
|mysql|
|test|
+--------------------+
4rowsinset(0.00sec)

从服务器Mysql查询,代码如下:

mysql>showdatabases;
+--------------------+
|Database|
+--------------------+
|information_schema|
|hi_db|//I'Mhere，大家看到了吧
|mysql|
|test|
+--------------------+
4rowsinset(0.00sec)
mysql>usehi_db
Databasechanged
mysql>select*fromhi_tb;//可以看到在主服务器上新增的具体数据
+------+------+
|id|name|
+------+------+
|1|wf|
+------+------+
1rowinset(0.00sec)//开源代码phpfensi.com

10、完成:编写一shell脚本,用nagios监控slave的两个“yes”,如发现只有一个或零个“yes”,就表明主从有问题了,发短信警报吧.

mysql 数据同步出现Slave_IO_Running:No问题的解决方法小结

mysql replication 中slave机器上有两个关键的进程,死一个都不行,一个是slave_sql_running,一个是Slave_IO_Running,一个负责与主机的io通信,一个负责自己的slave mysql进程.

下面写一下,这两个要是有no了,怎么恢复。。如果是slave_io_running no了,那么就我个人看有三种情况,一个是网络有问题,连接不上,像有一次我用虚拟机搭建replication,使用了nat的网络结构,就是死都连不上,第二个是有可能my.cnf有问题，配置文件怎么写就不说了,网上太多了,最后一个是授权的问题,replication slave和file权限是必须的,如果不怕死就all咯.

一旦io为no了先看err日志，看看爆什么错，很可能是网络，也有可能是包太大收不了，这个时候主备上改max_allowed_packet这个参数。

如果是slave_sql_running no了，那么也有两种可能，一种是slave机器上这个表中出现了其他的写操作，就是程序写了，这个是会有问题的，今天我想重现，但是有时候会有问题，有时候就没有问题，现在还不是太明了，后面再更新，还有一种占绝大多数可能的是slave进程重启，事务回滚造成的，这也是mysql的一种自我保护的措施，像关键时候只读一样。

这个时候想恢复的话，只要停掉slave，set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;再开一下slave就可以了，这个全局变量赋值为N的意思是：

This statement skips the next N events from the master. This is useful for recovering from replication stops caused by a statement.

This statement is valid only when the slave thread is not running. Otherwise, it produces an error.

呵呵,讲的比我清楚.

MYSQL镜像服务器因错误停止的恢复:下午主服务器,由于一些原因,导致死机,重启后,发现从服务器的数据没有跟上,配好MYSQL主从也才前几天的事,没多少经验,第一次碰上这问题,有点焦急,不过,自己试了下,还算解决了.

从服务器上:

Master_Log_File: mysqlhxmaster.000007

Read_Master_Log_Pos: 84285377

看一下主服务器:mysqlhxmaster.000007 | 84450528 |,已经过后很多了,确实没跟上.

show slave statusG

Slave_IO_Running: Yes

Slave_SQL_Running: No

有问题了,Slave_SQL_Running应该是Yes才对,再往下看,有错误的提示:

Last_Errno: 1053

Last_Error: Query partially completed on the master (error on master: 1053) and was aborted. There is a chance that your master is inconsistent at this point. If you are sure that your master is ok, run this query manually on the slave and then restart the slave with SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE; . Query: 'INSERT INTO hx_stat_record ......(一句SQL语句)'

这里有说明要怎么操作了,先stop slave，然后执行了一下提示的语句,再SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1; START SLAVE;

show slave statusG

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

OK了,从服务器也在几分钟内把堆积的log处理完了,两边又同步了,从MYSQL服务器Slave_IO_Running:No的解决2.

早晨机房意外断电,导致了发现mysql从服务器同步异常,使用以前碰到的Slave_SQL_Running为No的解决办法无效,仍然无法同步.

查看一下状态show slave status

Master_Log_File:mysqlmaster.000079
Read_Master_Log_Pos:183913228
Relay_Log_File:hx-relay-bin.002934
Relay_Log_Pos:183913371
Relay_Master_Log_File:mysqlmaster.000079
Slave_IO_Running:No
Slave_SQL_Running:Yes

主服务器show master statusG

File: mysqlmaster.000080

Position: 13818288

Binlog_Do_DB:

Binlog_Ignore_DB: mysql,test

mysql错误日志:

100512 9:13:17 [Note] Slave SQL thread initialized, starting replication in log 'mysqlmaster.000079' at position 183913228, relay log './hx-relay-bin.002934' position: 183913371

100512 9:13:17 [Note] Slave I/O thread: connected to master 'replicuser@192.168.1.21:3306', replication started in log 'mysqlmaster.000079' at position 183913228

100512 9:13:17 [ERROR] Error reading packet from server: Client requested master to start replication from impossible position ( server_errno=1236)

100512 9:13:17 [ERROR] Got fatal error 1236: 'Client requested master to start replication from impossible position' from master when reading data from binary log

100512 9:13:17 [Note] Slave I/O thread exiting, read up to log 'mysqlmaster.000079', position 183913228

这次是Slave_IO_Running为No,从日志上来看,服务器读mysqlmaster.000079这个Log的183913228这个位置时发生错误,这个位置不存在,于是无法同步.

查看一下这个Log的最后几行:

/*!40019 SET @@session.max_insert_delayed_threads=0*/;

/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;

# at 4

#100511 9:35:15 server id 1 end_log_pos 98 Start: binlog v 4, server v 5.0.27-standard-log created 100511 9:35:15

# Warning: this binlog was not closed properly. Most probably mysqld crashed writing it.

尝试从损坏之前的位置开始:

SLAVE STOP;

CHANGE MASTER TO MASTER_LOG_FILE='mysqlcncnmaster.000079', MASTER_LOG_POS=183913220;

SLAVE START;

无效！

只好从新的日志开始

SLAVE STOP;

CHANGE MASTER TO MASTER_LOG_FILE='mysqlcncnmaster.000080', MASTER_LOG_POS=0;

SLAVE START;

此时Slave_IO_Running恢复为Yes,同步进行了,观察了会儿,没有任何出错迹象,问题解决,另外,出现Slave_IO_Running:NO还有一个原因是slave上没有权限读master上的数据.