这是一种将海量的数据水平扩展的数据库集群系统数据分表存储在sharding的各个节点
上使用者通过简单的配置就可以很方便地构建一个分布式MongoDB集群。

MongoDB的数据分块称为chunk。每个chunk都是Collection中一段连续的数据记录通
常最大尺寸是200MB超出则生成新的数据块。


要构建一个MongoDBShardingCluster需要三种角色

1、ShardServer


即存储实际数据的分片每个Shard可以是一个mongod实例也可以是一组mongod实例
构成的ReplicaSet。为了实现每个Shard内部的auto-failoverMongoDB官方建议每个Shard
为一组ReplicaSet。


2、ConfigServer


为了将一个特定的collection存储在多个shard中需要为该collection指定一个shardkey
例如{age:1}shardkey可以决定该条记录属于哪个chunk。ConfigServers就是用来存储
所有shard节点的配置信息、每个chunk的shardkey范围、chunk在各shard的分布情况、
该集群中所有DB和collection的sharding配置信息。


3、RouteProcess


这是一个前端路由客户端由此接入然后询问ConfigServers需要到哪个Shard上查询或
保存记录再连接相应的Shard进行操作最后将结果返回给客户端。客户端只需要将原本
发给mongod的查询或更新请求原封不动地发给RoutingProcess而不必关心所操作的记录
存储在哪个Shard上。


下面我们在同一台物理机器上构建一个简单的ShardingCluster
架构图如下

创建数据目录和日志目录

启动ShardServer实例1和实例2

启动ConfigServer

启动RouteProcess

mongos启动参数中chunkSize这一项是用来指定chunk的大小的单位是MB默认大小
为200MB为了方便测试Sharding效果我们把chunkSize指定为1MB。

配置Sharding

接下来我们使用MongoDBShell登录到mongos添加Shard节点

验证Sharding正常工作

我们已经对test.users表进行了分片的设置下面我们们插入一些数据看一下结果

我们看一下磁盘上的物理文件情况

看上述结果表明test.users集合已经被分片处理了但是通过mongos路由我们并感觉
不到是数据存放在哪个shard的chunk上的这就是MongoDB用户体验上的一个优势即
对用户是透明的。