MongoDB学习札记之五

日期：2014-05-16　浏览次数：20479 次

MongoDB学习笔记之五

? Inserting

??? Document-Orientation

???? 在描述中，MongoDB是面向文档的，意味着在这种数据库中主要存储单位是Collection。

? ?? 一些常见的数据格式例如：JSON、XML、简单的键/值对。

???? 储存在MongoDB中的文档是一种类JSON格式，为了得到更高的效率，使用了一种二进制表现形式且被称为BSON的格式。目标是使数据更紧凑和合理以便于扫描。

???? 客户端序列化数据成BSON传送至数据库中，数据是以BSON格式被存储的。因此，读取数据的时候，数据库只需做很小的解析处理就可以传送出去，更加高效。然后客户端在反序列化BSON格式为当前语言使用的格式。

?? JSON

??? 一段数据：

{ author: 'joe',
  created : new Date('03-28-2009'),
  title : 'Yet another blog post',
  text : 'Here is the text...',
  tags : [ 'example', 'joe' ],
  comments : [ { author: 'jim', comment: 'I disagree' },
              { author: 'nancy', comment: 'Good post' }
  ]
}

???? 存储的实例：

> doc = { author : 'joe', created : new Date('03-28-2009'), ... }
> db.posts.insert(doc);

?? Mongo-Friendly Schema

???? Mongo可以用于很多方面，第一反应或许是如何用它来编写一个使用关系数据库的应用程序。虽然这项工作非常好，但是也不能展现Mongo的真正力量。Mongo就是被设计和工作在副

?? Store Example

  item
     title
     price
     sku
  item_features
     sku
     feature_name
     feature_value

??? 不同的商品有不同的属性，但又不想在一张表中包含所有可能出现的属性。(一般关系数据库中，可能都会另建属性表，跟分类表类似)在Mongo中同样可以创建这个模型，而且更加高效。

  item : {
           "title" : <title> ,
           "price" : <price> ,
           "sku"   : <sku>   ,
           "features" : {
              "optical zoom" : <value> ,
              ...
           }
  }

? ? 这样做有几个好处：

??? 1、一次数据库查询可以得到整条记录。。

??? 2、一条记录的所有信息都书存储在硬盘的的同一片区域，所以一次检索可以可以得到所有数据。

??? 3、插入或更新单条属性时：

db.items.update( { sku : 123 } , { "$set" : { "features.zoom" : "5" } } )

? ? 4、插入一条新属性不需要在硬盘上移动整条记录，Mongo有一个预留机制，预留出了一部分空间以适应数据对象的增长。也可以预防索引的增长等问题。

? Legal Key Names

??? 键的命名有以下限制：

?? 1. $不能出作为第一个字符

?? 2.(.)点不能出现在键名中

? Schema Design(数据库设计)

??? Introduction

???? 在Mongo里，比起设计数据库关系模式，你只需做很少的标准化工作， because there are no server-side "joins"。通常来说，都希望每个顶级对象对应一个Collection。

???? 每一种分类都建立一个Collection，只需创建一个嵌入式对象。例如在下面的图中，我们有两个Collection，student和coureses。学生Collection中包含一个嵌入的address文档和coursesCollection有联系的score文档。

????? 如果用关系数据库来设计，几乎肯定会把score分离出来单独做一张表，然后加一个外键和student相连。

??? Embed vs. Reference

????? 在Mongo数据库设计中关键的一句话是“比起嵌入到其他Collection中做一个子对象，每个对象值得拥有自己的Collection吗？”。在关系数据库中。每个有兴趣的子项目通常都会分离出来单独设计一张表（除非为了性能的考虑）。而在Mongo中，是不建议使用这种设计的，嵌入式的对象更高效。(这句不是很确定Data is then colocated on disk; client-server turnarounds to the database are eliminated)数据是即时同步到硬盘上的，客户端与服务器不必要在数据库上做周转。所以通常来说问题就是“为什么不使用嵌入式对象呢？”

????? 利用上面的例子，我们来看下为什么引用比较慢

print( student.address.city );

???? address是嵌入式对象，所以这个操作通常是很快速的，如果sdudent被放在内存中，那address也通常在内存中。然而下面这个例子：

print( student.scores[0].for_course.name );

???? 如果是第一次访问scores[0]的内容，会先执行下面这句：

// pseudocode for driver or framework, not user code

student.scores[0].for_course = db.courses.findOne({_id:_course_id_to_find_});

???? 因此，每一次引用遍历都是一个数据库查询。一般来说，有问题的Collection都是默认的在_id建有索引，查询会稍微快一些。然而即使所有的数据都缓存在内存中，鉴于服务器端/客户端的应用程序和数据库通信时仍然会有一些延迟。一般来说，期望在查询时缓存命中的境况下有1ms。因此，如果我们迭代1000 student，查找即使在有缓存的情况下仍然是很慢的，超过1m。如果我们只需要查找一条记录，时间应该在1ms左右，这对于一个网页加载来说是可以接受的。(注意：如果数据已经在缓存中,取出1000条数据也许花费时间少于1m,)

??? 一些规则：

?? 1、顶级对象，一般都有自己的Collection

?? 2、线性细节对象，一般作为嵌入式的

?? 3、一个对象和另一个对象是包含关系时通常采用嵌入式设计

?? 4、多对多的关系通常采取引用设计

?? 5、只含有几个简单对

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。