mongodb是最常用的nosql数据库,在数据库排名中已经上升到了前六。这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群。
在搭建集群之前,需要首先了解几个概念:路由,分片、副本集、配置服务器等。

相关概念

从图中可以看到有四个组件:mongos、config server、shard、replica set。
1.mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。2.config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!3.shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。4.replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。5.仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。
简单了解之后,我们可以这样总结一下,应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失同步在副本集中存储了一份,仲裁在数据存储到分片的时候决定存储到哪个节点。

环境准备

系统系统 Ubuntu 18.04.1 LTS 三台服务器:10.20.71.135/10.20.73.182/10.20.70.61 安装包:mongodb-org-server_4.0.6_amd64.deb

服务器规划

服务器mongo-135服务器mongo-182服务器mongo-61
mongosmongosmongos
config serverconfig serverconfig server
shard server1 主节点shard server1 副节点shard server1 仲裁
shard server2 仲裁shard server2 主节点shard server2 主节点
shard server3 副节点shard server3 仲裁shard server3 主节点
端口分配:
mongos20000config21000shard127017shard227017shard327017

集群搭建

1. mongodb源配置
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4echo "deb [ arch=amd64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.0 multiverse"| sudo tee /etc/apt/sources.list.d/mongodb-org-4.0.listsudo apt-get update会安装对应源的mongo所有依赖包,此处不执行# sudo apt-get install -y mongodb-orgecho "mongodb-org hold"| sudo dpkg --set-selectionsecho "mongodb-org-server hold"| sudo dpkg --set-selectionsecho "mongodb-org-shell hold"| sudo dpkg --set-selectionsecho "mongodb-org-mongos hold"| sudo dpkg --set-selectionsecho "mongodb-org-tools hold"| sudo dpkg --set-selections# 安装依赖apt install -y mongodb-org-mongos mongodb-org-shell mongodb-org-tools
参考
2. mongodb安装
wget https://repo.mongodb.org/apt/ubuntu/dists/bionic/mongodb-org/4.0/multiverse/binary-amd64/mongodb-org-server_4.0.6_amd64.debdpkg -i mongodb-org-server_4.0.6_amd64.deb
分别在每台机器建立conf、mongos、config、shard1、shard2、shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。
mkdir -p /usr/local/mongodb/confmkdir -p /usr/local/mongodb/mongos/logmkdir -p /usr/local/mongodb/configsvr/{data,log}mkdir -p /usr/local/mongodb/shard1/{date,log}mkdir -p /usr/local/mongodb/shard2/{data,log}mkdir -p /usr/local/mongodb/shard3/{data,log}

准备集群间通信使用的加密key

创建mongod、mongos之间通信所使用的key文件,在任意一台服务器上执行:
openssl rand -base64 756>/etc/mongodb/conf/keychmod 400/data/mongodb/conf/key# 将/data/mongodb/conf/key文件拷贝到其它服务器上,保持文件权限不变

connfig server配置服务器

mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。添加配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat configsrv.confstorage: dbPath:/data/mongodb/config/data journal: enabled:truesystemLog: destination: file logAppend:true path:/data/mongodb/config/log/configsrv.lognet: port:21000 bindIp:0.0.0.0processManagement: timeZoneInfo:/usr/share/zoneinfosecurity: keyFile:/data/mongodb/conf/key authorization: enabledreplication: replSetName: configssharding: clusterRole:"configsvr"
分别启动三台服务器的config server 方式一:
mongod -f /data/mongodb/conf/configsrv.conf
方式二:
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongosrv.service[Unit]Description=MongoDBDatabaseConfigServerAfter=network.targetDocumentation=https://docs.mongodb.org/manual[Service]User=mongodbGroup=mongodbEnvironmentFile=-/etc/default/mongodExecStart=/usr/bin/mongod --config /data/mongodb/conf/configsrv.confPIDFile=/data/mongodb/config/log/configsrv.pid# file sizeLimitFSIZE=infinity# cpu timeLimitCPU=infinity# virtual memory sizeLimitAS=infinity# open filesLimitNOFILE=64000# processes/threadsLimitNPROC=64000# locked memoryLimitMEMLOCK=infinity# total threads (user+kernel)TasksMax=infinityTasksAccounting=false# Recommended limits for for mongod as specified in# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings[Install]WantedBy=multi-user.target
systemctl daemon-reloadsystemctl start mongosrv.servicesystemctl enable mongosrv.service
登录任意一台配置服务器,初始化配置副本集
#连接mongo --port 21000#config变量config ={ _id :"configs", members :[{_id :0, host :"10.20.71.135:21000"},{_id :1, host :"10.20.73.182:21000"},{_id :2, host :"10.20.70.61:21000"}]}#初始化副本集rs.initiate(config)
其中,”_id” : “configs”应与配置文件中配置的 replicaction.replSetName 一致,”members” 中的 “host” 为三个节点的 ip 和 port

配置分片副本集(三台机器)

设置第一个分片副本集(shard1)

1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard1.confstorage: dbPath:/data/mongodb/shard1/data journal: enabled:truesystemLog: destination: file logAppend:true path:/data/mongodb/shard1/log/shard1.lognet: port:27017 bindIp:0.0.0.0processManagement: timeZoneInfo:/usr/share/zoneinfosecurity: keyFile:/data/mongodb/conf/key authorization: enabledreplication: replSetName: shard1sharding: clusterRole:"shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard1.service[Unit]Description=MongoDBShard1DatabaseServerAfter=network.targetDocumentation=https://docs.mongodb.org/manual[Service]User=mongodbGroup=mongodbEnvironmentFile=-/etc/default/mongodExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard1.confPIDFile=/data/mongodb/shard1/log/shard1.pid# file sizeLimitFSIZE=infinity# cpu timeLimitCPU=infinity# virtual memory sizeLimitAS=infinity# open filesLimitNOFILE=64000# processes/threadsLimitNPROC=64000# locked memoryLimitMEMLOCK=infinity# total threads (user+kernel)TasksMax=infinityTasksAccounting=false# Recommended limits for for mongod as specified in# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings[Install]WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reloadroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard1.serviceroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard1.service
启动方式二:
mongod -f /data/mongodb/conf/shard1.conf
登陆任意一台服务器,初始化副本集:
在任意一台服务上初始化复制集配置:mongo --port 27017#使用admin数据库use admin#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。config ={ _id :"shard1", members :[{_id :0, host :"10.20.71.135:27017"},{_id :1, host :"10.20.73.182:27017"},{_id :2, host :"10.20.70.61:27017", arbiterOnly:true}]}#初始化副本集配置rs.initiate(config);rs.status()rs.conf()

设置第二个分片副本集(shard2)

1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard2.confstorage: dbPath:/data/mongodb/shard2/data journal: enabled:truesystemLog: destination: file logAppend:true path:/data/mongodb/shard2/log/shard2.lognet: port:27018 bindIp:0.0.0.0processManagement: timeZoneInfo:/usr/share/zoneinfosecurity: keyFile:/data/mongodb/conf/key authorization: enabledreplication: replSetName: shard2sharding: clusterRole:"shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard2.service[Unit]Description=MongoDBShard2DatabaseServerAfter=network.targetDocumentation=https://docs.mongodb.org/manual[Service]User=mongodbGroup=mongodbEnvironmentFile=-/etc/default/mongodExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard2.confPIDFile=/data/mongodb/shard2/log/shard2.pid# file sizeLimitFSIZE=infinity# cpu timeLimitCPU=infinity# virtual memory sizeLimitAS=infinity# open filesLimitNOFILE=64000# processes/threadsLimitNPROC=64000# locked memoryLimitMEMLOCK=infinity# total threads (user+kernel)TasksMax=infinityTasksAccounting=false# Recommended limits for for mongod as specified in# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings[Install]WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reloadroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard2.serviceroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard2.service
启动方式二:
mongod -f /data/mongodb/conf/shard2.conf
登陆任意一台服务器,初始化副本集:
在任意一台服务上初始化复制集配置:mongo --port 27018#使用admin数据库use admin#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。config ={ _id :"shard2", members :[{_id :0, host :"10.20.71.135:27018"},{_id :1, host :"10.20.73.182:27018", arbiterOnly:true},{_id :2, host :"10.20.70.61:27018"}]}#初始化副本集配置rs.initiate(config);

设置第二个分片副本集(shard3)

1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard3.confstorage: dbPath:/data/mongodb/shard3/data journal: enabled:truesystemLog: destination: file logAppend:true path:/data/mongodb/shard3/log/shard3.lognet: port:27019 bindIp:0.0.0.0processManagement: timeZoneInfo:/usr/share/zoneinfosecurity: keyFile:/data/mongodb/conf/key authorization: enabledreplication: replSetName: shard3sharding: clusterRole:"shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard3.service[Unit]Description=MongoDBShard3DatabaseServerAfter=network.targetDocumentation=https://docs.mongodb.org/manual[Service]User=mongodbGroup=mongodbEnvironmentFile=-/etc/default/mongodExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard3.confPIDFile=/data/mongodb/shard3/log/shard3.pid# file sizeLimitFSIZE=infinity# cpu timeLimitCPU=infinity# virtual memory sizeLimitAS=infinity# open filesLimitNOFILE=64000# processes/threadsLimitNPROC=64000# locked memoryLimitMEMLOCK=infinity# total threads (user+kernel)TasksMax=infinityTasksAccounting=false# Recommended limits for for mongod as specified in# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings[Install]WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reloadroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard3.serviceroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard3.service
启动方式二:
mongod -f /data/mongodb/conf/shard3.conf
登陆任意一台服务器,初始化副本集:
mongo --port 27019use admin#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。config ={ _id :"shard3", members :[{_id :0, host :"10.20.71.135:27019",arbiterOnly:true},{_id :1, host :"10.20.73.182:27019"},{_id :2, host :"10.20.70.61:27019"}]}#初始化副本集配置rs.initiate(config);

配置路由服务器 mongos

先启动配置服务器和分片服务器,后启动路由实例:(三台机器) 1. 配置文件
systemLog: destination: file logAppend:true path:/data/mongodb/mongos/log/mongos.lognet: port:20000 bindIp:0.0.0.0processManagement: timeZoneInfo:/usr/share/zoneinfosecurity: keyFile:/data/mongodb/conf/key clusterAuthMode: keyFilereplication: localPingThresholdMs:15sharding:#监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字 configDB:"configs/10.20.71.135:21000,10.20.73.182:21000,10.20.70.61:21000"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongos.service[Unit]Description=MongoDBMongosDatabaseServerAfter=network.targetDocumentation=https://docs.mongodb.org/manual[Service]User=mongodbGroup=mongodbEnvironmentFile=-/etc/default/mongodExecStart=/usr/bin/mongos --config /data/mongodb/conf/mongos.confPIDFile=/data/mongodb/mongos/log/mongos.pid# file sizeLimitFSIZE=infinity# cpu timeLimitCPU=infinity# virtual memory sizeLimitAS=infinity# open filesLimitNOFILE=64000# processes/threadsLimitNPROC=64000# locked memoryLimitMEMLOCK=infinity# total threads (user+kernel)TasksMax=infinityTasksAccounting=false# Recommended limits for for mongod as specified in# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings[Install]WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reloadroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl enable mongosroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongos.serviceroot@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongos.service
启动方式二:
mongod -f /data/mongodb/conf/shard3.conf
3. 启用分片 目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。
mongo --port 20000#使用admin数据库use admin#串联路由服务器与分配副本集sh.addShard("shard1/10.20.71.135:27017,10.20.73.182:27017,10.20.70.61:27017")sh.addShard("shard2/10.20.71.135:27018,10.20.73.182:27018,10.20.70.61:27018")sh.addShard("shard3/10.20.71.135:27019,10.20.73.182:27019,10.20.70.61:27019")#查看集群状态sh.status()
⚠️ : 集群服务启动顺序 mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos. configsvr->shard->mongos 至此,整个mongodb高可用集群就搭建好了。

部署测试

1. 先建一个database及user创建数据
# 创建一个admin用户$ mongo --port 20000>use admin> db.createUser({ user:"weadmin", pwd:"123456",roles:[{ role:"userAdminAnyDatabase", db:"admin"},{ role:"clusterManager", db :"admin"}],passwordDigestor:"server"})>exit# 创建一个database的访问用户$ mongo --username weadmin --password 123456--authenticationDatabase admin --port 20000 admin>use test> db.createUser({user:"test",pwd:"123456",roles:[{ role:"dbOwner", db:"test"}],passwordDigestor:"server"});>exit# 使用该用户访问database,并插入数据,创建索引$ mongo --username test --password 123456--authenticationDatabase test --port 20000 test#插入测试数据>for(var i =1; i <=5000; i++){db.table1.save({id:i,"name":"shuke"})};>exit
2. 分片生效 目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。
$ mongo --username weadmin --password 123456--authenticationDatabase admin --port 20000 admin>use admin# 认证> db.auth("weadmin","123456")#指定testdb分片生效db.runCommand({ enablesharding :"test"});#指定数据库里需要分片的集合和片键db.runCommand({ shardcollection :"test.table1",key :{id:1}})
我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!
3. 测试分片配置结果:
$ mongo --username test --password 123456--authenticationDatabase test --port 20000 test>use test> db.auth("test","123456")#查看分片情况> db.table1.stats();

总结

手工部署mongodb集群还是比较麻烦的,所以如果图省事儿,还是使用云厂商提供的PaaS服务好了,比如云数据库 MongoDB。如果一定要自己搭建,还是建议用现成的ansible-mongodb-cluster脚本好了。

refs

mongodb高可用集群部署 - jeremy的技术点滴 mongodb 3.4 集群搭建:分片+副本集 - 纯洁的微笑博客 搭建 MongoDB分片(sharding) / 分区 / 集群环境 - 云+社区 - 腾讯云 MongoDB副本集配置 - 个人文章 - SegmentFault 思否 三个节点的复制集 — MongoDB Manual 3.4 在Ubuntu上安装MongoDB社区版 | 静水流深
☆ END ☆
继续阅读
阅读原文