问题描述:

在生产环境中,当辅助副本成员的读压力很大时,可通过添加新的辅助副本成员来缓解压力。

为了能实现主副本成员不停机,并减轻主副本成员的压力,可在辅助副本成员上mongodump备份数据;

为了实现新的辅助副本成员的快速恢复,可直接通过以NFS方式挂载辅助副本成员到做备份操作的辅助副本成员上;

为了保证数据的一致性,在mongodump数据的时候使用—oplog参数,mongorestore时使用—oplogReplay参数;

为了满足后期空间的扩容,通过—directoryperdb参数将数据库分目录存储。

解决方法:

步骤一:将新机器挂为NFS磁盘

参见:CentOS Linux上配置NFS网络文件系统以及客户端使用

步骤二:备份辅助副本成员

local数据库不会被备份,包括admin在内的其他库会被备份。

mongodump--host=192.168.11.1:27017--oplog-o/mnt/mongo/mongodata-uxucy–pPassw0rd--authenticationDatabaseadmin>mongodump.log2>&1&

可通过实时查看日志数据,观察备份进度。

tail–fmongodump.log

步骤三:在新实例上恢复数据库

mongorestore要在mongod未启动的情况下运行,它直接写入文件。

mongorestore--host=192.168.11.2:27017--oplogReplay--dbpath/data/var/lib/mongodb--directoryperdb/nfspool/mongodata>mongorestore.log2>&1&

可通过实时查看日志数据,观察恢复进度。

tail–fmongorestore.log

步骤四:在新实例上重建oplog

1.查看主副本的维护窗口和oplog大小:

rs_main:PRIMARY> db.printReplicationInfo()
configured oplog size: 23862.404296875MB
log length start to end: 39405secs (10.95hrs)
oplog first event time: Sun Feb 08 2015 10:34:07 GMT-0600 (CST)
oplog last event time: Sun Feb 08 2015 21:30:52 GMT-0600 (CST)
now: Sun Feb 08 2015 21:30:53 GMT-0600 (CST)

2.在新机器上重建oplog:

以standalone方式启动,执行如下删除和创建脚本:

>uselocal>db.oplog.rs.drop()>db.createCollection("oplog.rs",{"capped":true,"size":23*1024*1024*1024})或>db.runCommand({create:"oplog.rs",capped:true,size:(23*1024*1024*1024)})


步骤五:在新实例上恢复oplog

此oplog是mongodump时导出的oplog.bson。

mongorestore-dlocal-coplog.rs/nfspool/mongodata/oplog.bson

步骤六:新实例以副本集启动

新实例配置和源副本集添加相同的--replSet和--keyFile参数,以副本集启动

步骤七:将该节点添加到复制集集群中

>rs.add(“192.168.11.2:27017”){“ok”:1}