mongodb用来做什么[mongodb教程]

Z时代
2024-01-10
分类：综合

python

一年多一直在使用mongodb，基本上从对mongodb不懂的小白，到现在操作mongodb无任何压力，最近的一个项目在做mongodb副本集的管理，三组机器做一个副本集，大概要管几十台上百台副本集，主要用来自动化发布，构建副本集（我们的mongo副本集部署在docker中），所以在写各种mongo shell的代码实现，说白了就是调用mongo的commands。看到这个问题特来回答一下。

mongodb众所周知不支持事务，所以需要强事务的业务根本不能考虑mongodb。

mongodb的优势就是文档存储:

1. 业务经常变动，需要不时的添加字段，那么mongodb比较适合，关系型数据库添加字段的复杂度也还好

2. 嵌套文档，业务数据比较复杂，适合嵌套文档式存储，那么mongodb非常合适，这个关系型数据库比较难搞，虽然MySQL和pg也有文档存储，但MySQL的不成熟，pg毕竟现在生产中使用还是偏少，个人也不了解，这里不谈。但这不仅仅这一点优势，具体下面会细说。

3. upsert支持，查询速度也不慢

4. 高可用的副本集支持

5. 查询语法非常丰富，嵌套文档查询功能非常强大，不是重度用户可能不能理解

下面说说一个具体的使用事例:

项目的一条数据在10kb左右，如果使用关系型数据库那么需要将这条数据拆分成大概几百条左右，建造多个表，设计较复杂，这种数据大概在一百万条左右，想想拆分后在十几亿的数据量就可怕。打平后的数据什么DB也都可以拿下，只是一百万变十几亿比较恐怖而已。

如果采用MySQL存储，每次查询需要使用外键查询多个表，从这些表中拉取数据，性能肯定要下降很多，比不上只在一个表查询，而且只拉取少两个数量级的数据。查询也还好，业务允许可以对结果做缓存，放到redis里去。

但是重点来了，需求要增量更新部分数据，这时候需要更新多个表，根本没法做到原子性（注意事务不是原子操作），当然也可以使用cas等技术补偿，达到最终一致性。但使用mongodb存储只需要update一条数据，对相应的嵌套文档中内容更新，可以做到原子性，是不是很方便？

具体说说该项目的难点，查询无法使用缓存，可能会很吃惊，但是业务决定了确实做不了，而且增量更新的量达到上万的QPS，如果不能保证原子性想想多么可怕！