MongoDB 介绍

MongoDB 有各种语言的官方驱动。

MongoDB 相比 RDBMS 的优势 #

面向文档数据库经常吹嘘的一个好处就是，它不需要一个固定的模式。这使得他们比传统的数据库表要灵活得多。无模式是酷，可是大多数情况下你的数据结构还是应当好好设计的。

MongoDB 可以胜任的一个特殊角色是在日志领域。有两点使得 MongoDB 的写操作非常快。

MongoDB 还提供了受限集合(capped collection)。可以通过 db.createCollection 命令来创建一个受限集合并标记它的限制:

//limit our capped collection to 1 megabyte
db.createCollection('logs', {capped: true, size: 1048576})

另外一种限制可以基于文档个数，而不是大小，用 max 标记。

如果想让你的数据 “过期” ，基于时间而不是整个集合的大小，可以用 TTL 索引，所谓 TTL 是 “time-to-live” 的缩写。

从 2.0 版的 MongoDB 开始，日志是默认启动的，该功能允许快速恢复服务器，比如遭遇到了服务器崩溃或者停电的情况。

全文检索是在最近加入到 MongoDB 中的。它支持十五国语言，支持词形变化(stemming)和干扰字(stop words)。除了原生的 MongoDB 的全文检索支持，如果你需要一个更强大更全面的全文检索引擎的话，你需要另找方案。

MongoDB 不支持事务。这有两个代替案，一个很好用但有限制，另外一个比较麻烦但灵活。

MongoDB 提供了针对单个文档的原子操作。比如 $inc 和 $set。还有像 findAndModify 命令，可以更新或删除文档之后，自动返回修改过的文档。

维持原子性的建议方法是利用内嵌文档（embedded document）将所有经常更新的相关信息都保存在一个文档中。这能确保所有针对单一文档的更新具有原子性。

两段提交实际上在关系型数据库世界中非常常用，用来实现多数据库之间的事务。 MongoDB 网站有个例子演示了最典型的场合 (资金转账)。通常的想法是，把事务的状态保存到实际的原子更新的文档中，然后手工的进行 init-pending-commit/rollback 处理。

MongoDB 支持内嵌文档以及它灵活的 schema 设计，让两步提交没那么痛苦，但是它仍然不是一个好处理。

MongoDB 依赖 MapReduce 来解决大部分数据处理工作。

在 2.2 版本，它追加了一个强力的功能，叫做 aggregation framework or pipeline，因此你只要对那些尚未支持管道的，需要使用复杂方法的，不常见的聚合使用 MapReduce。

MongoDB 支持 geospatial 索引。这允许你保存 geoJSON 或者 x 和 y 坐标到文档，并查询文档，用如 $near 来获取坐标集，或者 $within 来获取一个矩形或圆中的点。