mongodb 小结-数据库教程-爱易网页

mongodb 小结

日期：2014-05-16　浏览次数：20470 次

mongodb 总结

生产环境最佳实践
1.linux 系统：
1】关闭文件系统/分区的atime 选项
Vi /etc/fstab
在对应的分区项后面添加noatime ,nodiratime
LABEL=/1 / ext3 defaults 1 1
LABEL=/data1 /data ext4 defaults,noatime,nodiratime 1 2
2】设置文件句柄４ｋ＋，目前该配置已经集成到启动脚本中。
Vi /etc/security/limit.conf
* soft nproc 65536
* hard nproc 65536
* soft nofile 65536
* hard nofile 65536
3】不要使用large vm page （不要使用大内存页选项）
Linux 大内存页参考：http://linuxgazette.net/155/krishnakumar.html
4】用dmesg 查看主机的信息。
2.linux 文件系统的选择：
Mongodb 采用预分配的大文件来存储数据,我们推荐
1】ext4
2】xfs
3.内核版本：
网络上对2.6.33-31 以及2.6.32 的表现持怀疑度，而强力推荐2.6.36
4.线程堆栈的尺寸
默认的线程堆栈尺寸为10m ，调整为1m ，已经集成在启动脚本中。
项目过程中的总结与建议
1.大小写问题
mongodb 是默认区分大小写的，但是这会不会衍生出跟mysql 一样的问题？（mysql 区
分大小写，导致windows 与linux 下的表名，字段名不一致）。
如果无特别用途，建议表名，字段名全部用小写字母。
2.尽可能的缩短字段名的长度
mongodb 的schema free 导致了每笔数据都要存储他的key 以及属性，这导致了这些数
据的大量冗余。开发同事也许考虑到，从易读性出发设计的key 基本比较长，基本都是按
照起字面意思去设计的。这导致key 很长。对应的数据存储占用了很大的空间。
必要的时候，可以考虑建立一个key 与实际意义的map 表，尽量降低key 的长度。
示例定义：
// 基本信息
static string _ID = "_id";
static string STATUS_CODE = "sc";
// 缓冲
static string DATE = "date";
static string MAX_AGE = "age";
// 内容
static string CONTENT = "content";
static string CONTENT_TYPE = "ctype";
static string CONTENT_LENGTH = "clen";
static string ZIP = "zip";
3. mongodb 单表最大索引数为64
无索引排序的最大数据量为4M, 超过则报错退出。
建议where 条件尽量落在索引字段上，排序字段需要建立索引，索引的使用原则与oracle
mysql 一致，尽量降低索引数量，索引长度。
mongodb 的查询每次只能用到一个索引，对数据的查询不会“并发”执行
例如： db.tab.find({'id'=1,'name'=2}) 如果‘id’，‘name' 列上分别有索引
对查询效率提升意义不大，如果索引为（'id','name') 则大幅提升效率。
4.mongodb 添加字段
如果添加字段且带有default 值，需要全部数据都要修改，这也是设计阶段需要考虑的
事情，这个问题的另外一种解法是应用代码里做一次判断。
5.测试过程的密码问题
对于用作数据库使用的Mongodb，在代码测试阶段都应加上密码验证，目前上线阶段基
本都会在密码验证方面出现问题（做缓存使用的可以不做密码验证)。
6.数据源连接方式
使用连接池模式，尽量减少认证带来的性能额外消耗
建议采用标准的uri 连接方式： mongodb://user:passwd@host:port,host:port/db
7.Mongodb日志量
正常情况下不需要开启-v 日志选项。
Mongodb 的-v 日志适合在开发环境的调试线上部署不建议采用这个参数，目前线上
部署的情况，-v 日志一天也会有几个G 的日志量，去掉这个参数，跟数据查询相关的操作
就不会记日志了，数据库的内部的重要操作还是会写日志的。
8.连接数大小的设置
Mongodb 驱动程序采用的连接池的方式连接到数据库，目前从观察到的情况是应用一
开启便根据变量的设置，建立全部连接，然后提供给程序使用，并且一旦其中某个连接
到数据库的访问失败，则会清空整个连接池到这台数据库的连接，并重新建立连接。
而mongodb 对中断连接的垃圾清理工作则是懒惰的被动清理方式，如果驱动程序端配
置的连接数过大，一旦发生重连，则会导致mongo 端堆积大量的垃圾连接数据，导致
主机资源耗尽。
建议： mongodb 驱动的连接池大小的设置一般应该控制100 以下，一般情况30-50 足
够支撑应用访问。
9.锁的问题
Mongodb 对数据库的访问全部加锁，如果是查询请求则设置共享锁，数据修改请求，
则设置全局排他锁，并且是实例级别的排他锁。并且写锁会阻塞读请求，如果长时间持有
写锁，会阻塞整个实例的读请求。
部署建议：
1】一般情况下，建议不同的应用不要合用一套示例。
2】如果资源不满足，需要合用，应该具有相同属性的应用合用一套实例。
例如合同mongo 的应用都是读多写少，防止一台写多应用阻塞读请求。
10.关于map/reduce问题
mongodb 对map/reduce 的支持是单线程的，我们不建议在前台使用该功能， group by
是通过map/reduce 实现的，开发过程中，要慎用。
11.安全问题
1】Mongodb 运行在mongodb 用户之上，并禁止mongodb 用户登录
2】使用Mongodb 自带的认证方法（adduser、auth）限制用户访问行为
3】将Mongodb 置于内网环境中
4】Mongodb 必须暴露在外网环境中的时候，使用IPTABLES 等网络层技术进行防护
5】网络层面内容为明文传输，可以考虑存储加密文档，应用端，加解密。
12.性能监控
Mongodb 自带有性能数据收集系统
Mongostat 实时采集数据库的多项指标,提供http console 端口号为应用端口号+1000。
关注的主要性能指标：
1】Faults：显示Mongodb 每秒页面故障的数量，这个是mongoDB 映射到虚拟地址空间，
而不是物理内存，这个值如果飙高的话，可能意味着机器没有足够的内存来
存储数据和索引。
2】Flushes：每秒做了多少次fsync，显示多少次数据被刷新进了磁盘
3】locked：写锁
4】idx miss：索引未命中比例
5】qr | qw：读写锁的请求队列长度。
6】conn：当前已经建立的连接数。
其他命令：
Db.stat()
db.serverStatuse()
Db.collection.stats()
13.碎片问题
Mongodb 数据库如果数据修改很频繁，会出现比较严重的空间碎片问题，表现在磁盘
文件扩张与实际数据量不相符，内存不够用，索引命中率低，查询效率降低。
碎片整理，目前我们采用的版本没有太有效的方法。
可以用db.repaireDatabase() 来整理数据库，这个过程非常的慢
如果是Master-slave 模式则相当于执行一次主从切换，然后从新建立从库。
如果是replSet 架构可以停掉数据库，然后删除数据目录，从新从复制复制组中全同步数据，
这个时候要考虑oplog 的尺寸。
一个大体的步骤：
1.】先调用rs.freeze(

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

mongodb 小结

相关资料更多>

推荐阅读更多>