python – 在MongoDB文档中过滤数组

我正在尝试根据推特用户提及创建网络地图.我将数据存储在MongoDB中,无法弄清楚如何删除不需要的用户.

示例db文档:

{
  'user': 'user1'
  'mentioned_users: ['user2', 'user3']
}
{
  'user': 'user2'
  'mentioned_users: ['user1', 'user3']
}

示例所需输出:

{
  'user': 'user1'
  'mentioned_users': ['user2']
}
{
  'user': 'user2'
  'mentioned_users': ['user1']
}

user3存在于提到的用户的user1和user2列表中,但是user3是无关的,因为user3在集合中没有自己的文档.

我需要使用db.collection.find()或其他方法的过滤器,以便我可以摆脱所有无关的用户.

用pymongo有一个简单的方法吗,或者我应该创建一个python解决方案?

最佳答案 你可以在MongoDB中实现查询usign聚合.可以尝试这个

db.users.aggregate([
  {$unwind: "$mentioned_users"},
  {$lookup: {from: "users", localField: "mentioned_users", foreignField: "user", as: "validUser"}},
  {$match: {"validUser.user": {$exists: true}}},
  {
    $group: {
      _id: "$_id",
      user: {$first: "$user"},
      mentioned_users: {$push: "$mentioned_users"}
    }
  }
])

然后输出就像

{
  "_id" : ObjectId("5a13bc87400096bfa0b34228"),
  "user" : "user1",
  "mentioned_users" : ["user2"]
}
{
  "_id" : ObjectId("5a13bc87400096bfa0b34229"),
  "user" : "user2",
  "mentioned_users" : ["user1"]
}
点赞