使用来自另一个集合的属性在mongodb上过滤文档的更好方法

我正在尝试使用另一个集合中的属性来过滤
mongodb上的文档,但问题是我需要先获取所有对象然后再进行过滤.这是我目前的情况:

目前的数据:

/* Message collection */
/* 1 */
{
    "_id" : ObjectId("571063533e41b42c2753828a"),
    "user" : ObjectId("570ae3d0a27d4cd44730fc38"),
    "text" : "First text",
    "enabled" : true,
    "deleted" : false,
    "__v" : 0
}

/* 2 */
{
    "_id" : ObjectId("5712a9be27adcff81ea5a39f"),
    "user" : ObjectId("5f236vgh74de563swer120rt"),
    "text" : "Second text",
    "deleted" : false,
    "enabled" : true,
    "__v" : 0
}

/* User collection */
/* 1 */
{
    "_id" : ObjectId("570ae3d0a27d4cd44730fc38"),
    "email" : "test@test.com",
    "showMessage" : true,
    "__v" : 0
}

/* 2 */
{
    "_id" : ObjectId("5f236vgh74de563swer120rt"),
    "email" : "test1@test.com",
    "showMessage" : false,
    "__v" : 0
}

目前的过滤方式:

Message.aggregate([{
            $match: {
                enabled: true,
                deleted: false
            }
        }, {
            $lookup: {
                from: 'users',
                localField: 'user',
                foreignField: '_id',
                as: 'user'
            }
        }], function(err, messages) {
            if (err) {
                reject(err);
            } else {
                var filteredMessages = this.filterMessages(messages);
                //do other stuff with the filtered data
            }
        });

filterMessages(messages) {
    return messages.filter((current) => {
        return current.user[0].showMessage;
    });
}

正如您所看到的,我正在尝试使用来自用户的属性showMessages来获取消息,但是在我首先获取所有消息之后我正在执行过滤器,这是一种低效的方法.

有没有办法只获取我需要的消息,使用另一个集合中的属性过滤它们?

注意:我需要使用用户属性过滤所有消息,不是相反,我的意思是,我无法获取用户,然后过滤消息.

最佳答案 只需直接在汇总中执行:

Message.aggregate([
  { "$match": {
    "enabled": true,
    "deleted": false  
  }},
  { "$lookup": {
    "from": "users",
    "localField": "user",
    "foreignField": "_id",
    "as": "user"
  }},
  { "$unwind": "user" },
  { "$redact": {
      "if": "$user.showMessage",
      "then": "$$KEEP",
      "else": "$$PRUNE"
  }}
],function(err,messages) {
    if (err) reject(err);
    // Already filtered
})

所以$unwind是单一关系(因为$lookup是“左连接”),然后只是$redact,条件是值为true / false.

或者反向执行$lookup,这可能更高效:

User.aggregate([
  { "$match": { "showMessage": true } },
  { "$lookup": {
    "from": "messages",
    "localField": "_id",
    "foreignField": "user",
    "as": "messages"
  }},
  { "$unwind": "$messages" },
  { "$match": {
      "messages.enabled": true,
      "messages.deleted": false
  }},
  { "$project": {
    "_id": "$messages._id",
    "user": {
      "_id": "$_id",
      "email": "$email",
      "showMessage": "$showMessage"
    },
    "text": "$messages.text",
    "deleted": "$messages.deleted",
    "enabled": "$messages.enabled"
  }}
],function(err,messages) {

})

目前,$lookup操作符本身不会根据“本地”和“外国”字段属性的匹配之外的任何其他条件来“查询”文档.这可能会在以后的版本中发生变化.

但就目前而言,您在后续聚合管道阶段中进行了这样的“过滤”.

另一种情况是实际上在“反向”查询,其中您获取有效用户数据的_id值,然后仅检索消息.但是,当然,如果$in的结果列表实际上不是太大:

async.waterfall
  [
    function(callback) {
      User.find({ "showMesage": true }).select("_id").exec(callback);
    },
    function(users,callback) {
      Message.find({
        "user": { "$in": users.map((current) => { return current._id }) },
        "enabled": true,
        "deleted": false
      }).populate("user").exec(callback);
    }
  ],function(err,messages) {
    // filter and populated
  }
)

$lookup相比,它是额外的查询,但它在最终匹配时处理的结果较少.

这实际上取决于你的数据在这里最好用的情况,所以你真的应该测试它.我的猜测会说$lookup的“反向”集合选择或仅使用$in的后一种情况将是更好的选择.但这实际上取决于哪个查询产生的结果最少,哪个“订单”最好.

点赞