Mongodb 的高级查询

关键词:mongodb, mongo, project, group, aggregate, 聚合管道, 高级查询

简介

管道,即,前一个操作的输出(结果)是后一个操作的输入。

鸡蛋 -> 分出鸡蛋清 -> 加入牛奶并打发 -> 奶油

这就是一个管道,有四个阶段,前一个阶段的结果是后一个的输入。
管道,可能是因为看起来像一个管道

mongo 的管道操作

db.collection.aggregate( [ { <stage> }, ... ] )

例如,对user文档进行管道聚合:

db.user.aggregate([
  {第一个操作},
  {第二个操作},
  {第三个操作}
])

其中每个操作可以对应下面的任意一个:

例如有user的库(collection)

{
  username: 'abc',
  password: '123'
}

1. $project「投影」

db.user.aggregate([
  {
    $project: {
      username: 1
    }
  }
])

或者看起来是这样(为了和上面对比):

db.user.aggregate([
  { $project: {username: 1} }
])

查询结果:

{
  username: 'abc'
}

1 == true 保留
0 == false 丢弃
下面同理

2. $match「匹配」

匹配出满足条件的数据项,条件与mongo查询条件一致

db.user.aggregate([
  { $match: { username: 'abc' } }
])

注意:如果需要按条件聚合的话,优先使用$match操作,会提高效率

例如应该这样:

db.user.aggregate([
  { $match: { username: 'abc' } }, // 放在首位
  { $project: { username: 1 } }
])

不是这样:

db.user.aggregate([
  { $project: { username: 1 } },
  { $match: { username: 'abc' } }
])

3. $group「分组」

对数据进行分组,我一般用于统计使用,暂时没有用作其他

db.user.aggregate([
  { $group: {_id: '$username', sum: { $sum: 1 } } }
])

格式化一下:

db.user.aggregate([
  {
    $group: {
      _id: '$username', // _id 是 group 操作的必须参数,即要分组的主键
      sum_result: { $sum: 1 } // sum_result 是自定义结果字段,$sum 是操作符,这里意思是「加 1」
    }
  }
])

稍微解释一下:
_id 是必须的字段:

  • 后面接 1 ,意思就是有多少条数据就返回多少条结果;
  • 后面接字段名(即:”$ + 字段名” 形式),会以该字段进行分组,所有此字段的值相同的数据都将分到同一组

sum_result 是自定义字段:

  • 结果(value)为 { $sum: 1 },即加1,也可以写成 { $sum: '$username' } 类似的字段名,如果该字段为数字,则累加数字;
  • 分到同一组的每条都将执行一次本操作,本示例得到的结果为,同名的用户个数统计

具体使用示例参考如下

请替换 collectionName 为自己所要操作的文档(库)名

db.collectionName.aggregate([
  {
    $match: { // 匹配 date 字段在 start_time 和 end_time 之间的数据
      date: { $gt: start_time, $lt: end_time }
    }
  }, {
    $project: { // 投影
      user: 1,
      type_1: { // 如果 type 字段等于 1,则 type_1 等于 1,否则为 null
        $cond: [ { $eq: ['$type', 1 ] }, 1, null ]
      },
      type_2: { // 如果 type 字段等于 2,则 type_2 等于 1,否则为 null
        $cond: [ { $eq: ['$type', 2 ] }, 1, null ]
      }
    }
  }, {
    $group: {  // 分组
      _id: '$user',
      chat: {$sum: '$type_1'}, // 累加 type_1 字段
      check: {$sum: '$type_2'} // 累加 type_2 字段
    }
  }
]);

举个栗子

去重复后的数量

db.collectionName.aggregate([
  {
    $match: {
      isAdded: false // 一些筛选条件
    }
  }, {
    $group: {  // 分组
      _id: '$content', // 需要去重的字段
    }
  }, {
    $group: {  // 分组
      _id: 1,
      count: {$sum: 1} // 去重之后的数量
    }
  }
]);
    原文作者:千罹
    原文地址: https://www.jianshu.com/p/cc486bfe35f9
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞