MongoDB支持在多个机器中通过异步复制达到故障转移和实现冗余。多机器中同一时刻只
有一台是用于写操作。正是由于这个情况,为MongoDB提供了数据一致性的保障。担当
Primary角色的机器能把读操作分发给slave。


MongoDB高可用可用分两种:
1、Master-Slave主从复制:
只需要在某一个服务启动时加上–master参数,而另一个服务加上–slave与–source参数,
即可实现同步。MongoDB的最新版本已不再推荐此方案。
2、ReplicaSets复制集:
MongoDB在1.6版本对开发了新功能replicaset,这比之前的replication功能要强大一
些,增加了故障自动切换和自动修复成员节点,各个DB之间数据完全一致,大大降低了维
护成功。建议使用replicaset,replicaset故障切换完全自动。
ReplicaSets的结构非常类似一个集群。是的,你完全可以把它当成集群,因为它确实跟集群实现的作用是一样的,其中一个节点如果出现故障,其它节点马上会将业务接过来而无须停机操作。


一、部署ReplicaSets

1、创建数据文件存储路径

root@Jane:/home/jane# mkdir -p /data/data/r0root@Jane:/home/jane# mkdir -p /data/data/r1root@Jane:/home/jane# mkdir -p /data/data/r2

2、创建日志文件路径

root@Jane:/home/jane# mkdir -p /data/log

3、创建主从key文件,用于标识集群的私钥的完整路径,如果各个实例的keyfile内容不一
致,程序将不能正常用。

root@Jane:/# mkdir -p /data/keyroot@Jane:/# echo 'this is rs1 super secret key' > /data/key/r0root@Jane:/# echo 'this is rs1 super secret key' > /data/key/r1root@Jane:/# echo 'this is rs1 super secret key' > /data/key/r2root@Jane:/data/key# chmod 600 r*

4、启动3个实例

root@Jane:/# mongod --replSet rs1 --keyFile /data/key/r0 --port 28010 --dbpath /data/data/r0 --logpath /data/log/r0.log --logappend --forkroot@Jane:/# mongod --replSet rs1 --keyFile /data/key/r1 --port 28011 --dbpath /data/data/r1 --logpath /data/log/r1.log --logappend --forkroot@Jane:/# mongod --replSet rs1 --keyFile /data/key/r2 --port 28012 --dbpath /data/data/r2 --logpath /data/log/r2.log --logappend --fork

5、配置及初始化ReplicaSets

其中的{_id:0,host:'127.0.0.1:28010',priority:1}说明一下:

--成员IP及端口,priority=1指PRIMARY

6、初始化配置

> rs.initiate(config_rs1);{"info" : "Config now saved locally. Should come online in about a minute.","ok" : 1}

7、查看复制集状态

rs.status(){"set" : "rs1","date" : ISODate("2013-11-21T08:30:06Z"),"myState" : 1,"members" : [{"_id" : 0,"name" : "127.0.0.1:28010","health" : 1,#--1 表明正常; 0 表明异常"state" : 1,#-1 表明是 Primary; 2 表明是 Secondary;"stateStr" : "PRIMARY",#--表明此机器是主库"uptime" : 9315,"optime" : Timestamp(1385013939, 1),"optimeDate" : ISODate("2013-11-21T06:05:39Z"),"self" : true},{"_id" : 1,"name" : "127.0.0.1:28011","health" : 1,"state" : 2,"stateStr" : "SECONDARY","uptime" : 8662,"optime" : Timestamp(1385013939, 1),"optimeDate" : ISODate("2013-11-21T06:05:39Z"),"lastHeartbeat" : ISODate("2013-11-21T08:30:04Z"),"lastHeartbeatRecv" : ISODate("2013-11-21T08:30:04Z"),"pingMs" : 0,"syncingTo" : "127.0.0.1:28010"},{"_id" : 2,"name" : "127.0.0.1:28012","health" : 1,"state" : 2,"stateStr" : "SECONDARY","uptime" : 8660,"optime" : Timestamp(1385013939, 1),"optimeDate" : ISODate("2013-11-21T06:05:39Z"),"lastHeartbeat" : ISODate("2013-11-21T08:30:04Z"),"lastHeartbeatRecv" : ISODate("2013-11-21T08:30:05Z"),"pingMs" : 0,"syncingTo" : "127.0.0.1:28010"}],"ok" : 1}

还可以用isMaster查看ReplicaSets状态。

rs1:PRIMARY> rs.isMaster(){"setName" : "rs1","ismaster" : true,"secondary" : false,"hosts" : ["127.0.0.1:28010","127.0.0.1:28012","127.0.0.1:28011"],"primary" : "127.0.0.1:28010","me" : "127.0.0.1:28010","maxBsonObjectSize" : 16777216,"maxMessageSizeBytes" : 48000000,"localTime" : ISODate("2013-11-21T08:39:09.364Z"),"ok" : 1}


二、主从操作日志oplog
MongoDB的ReplicaSet架构是通过一个日志来存储写操作的,这个日志就叫做”oplog”。
oplog.rs是一个固定长度的cappedcollection,它存在于”local”数据库中,用于记录Replica
Sets操作日志。在默认情况下,对于64位的MongoDB,oplog是比较大的,可以达到5%的磁
盘空间。oplog的大小是可以通过mongod的参数”—oplogSize”来改变oplog的日志大小。

具体看一下例子吧:

字段说明:
ts:某个操作的时间戳
op:操作类型,如下:
i:insert
d:delete
u:update
ns:命名空间,也就是操作的collectionname
o:document的内容


查看master的oplog元数据信息:


rs1:PRIMARY> db.printReplicationInfo()configured oplog size: 3694.1673828125004MBlog length start to end: 10772secs (2.99hrs)oplog first event time: Thu Nov 21 2013 14:05:39 GMT+0800 (CST)oplog last event time: Thu Nov 21 2013 17:05:11 GMT+0800 (CST)now: Thu Nov 21 2013 17:16:37 GMT+0800 (CST)rs1:PRIMARY>

字段说明:
configuredoplogsize:配置的oplog文件大小

loglengthstarttoend:oplog日志的启用时间段

oplogfirsteventtime:第一个事务日志的产生时间

oploglasteventtime:最后一个事务日志的产生时间
now:现在的时间

查看slave的同步状态:

rs1:PRIMARY> db.printSlaveReplicationInfo()source: 127.0.0.1:28011syncedTo: Thu Nov 21 2013 17:05:11 GMT+0800 (CST)= 1644 secs ago (0.46hrs)source: 127.0.0.1:28012syncedTo: Thu Nov 21 2013 17:05:11 GMT+0800 (CST)= 1644 secs ago (0.46hrs)rs1:PRIMARY>


字段说明:
source:从库的IP及端口

syncedTo:目前的同步情况,延迟了多久等信息


三、主从配置信息

在local库中不仅有主从日志oplog集合,还有一个集合用于记录主从配置信息–
system.replset

从这个集合中可以看出,ReplicaSets的配置信息,也可以在任何一个成员实例上执行rs.conf()
来查看配置信息。