MongoDB实战(11)Sharding 分片(上)
这是一种将海量的数据水平扩展的数据库集群系统数据分表存储在sharding的各个节点
上使用者通过简单的配置就可以很方便地构建一个分布式MongoDB集群。
MongoDB的数据分块称为chunk。每个chunk都是Collection中一段连续的数据记录通
常最大尺寸是200MB超出则生成新的数据块。
要构建一个MongoDBShardingCluster需要三种角色
1、ShardServer
即存储实际数据的分片每个Shard可以是一个mongod实例也可以是一组mongod实例
构成的ReplicaSet。为了实现每个Shard内部的auto-failoverMongoDB官方建议每个Shard
为一组ReplicaSet。
2、ConfigServer
为了将一个特定的collection存储在多个shard中需要为该collection指定一个shardkey
例如{age:1}shardkey可以决定该条记录属于哪个chunk。ConfigServers就是用来存储
所有shard节点的配置信息、每个chunk的shardkey范围、chunk在各shard的分布情况、
该集群中所有DB和collection的sharding配置信息。
3、RouteProcess
这是一个前端路由客户端由此接入然后询问ConfigServers需要到哪个Shard上查询或
保存记录再连接相应的Shard进行操作最后将结果返回给客户端。客户端只需要将原本
发给mongod的查询或更新请求原封不动地发给RoutingProcess而不必关心所操作的记录
存储在哪个Shard上。
下面我们在同一台物理机器上构建一个简单的ShardingCluster
架构图如下
创建数据目录和日志目录
启动ShardServer实例1和实例2
启动ConfigServer
启动RouteProcess
mongos启动参数中chunkSize这一项是用来指定chunk的大小的单位是MB默认大小
为200MB为了方便测试Sharding效果我们把chunkSize指定为1MB。
配置Sharding
接下来我们使用MongoDBShell登录到mongos添加Shard节点
验证Sharding正常工作
我们已经对test.users表进行了分片的设置下面我们们插入一些数据看一下结果
我们看一下磁盘上的物理文件情况
看上述结果表明test.users集合已经被分片处理了但是通过mongos路由我们并感觉
不到是数据存放在哪个shard的chunk上的这就是MongoDB用户体验上的一个优势即
对用户是透明的。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。