c# – 如何在RavenDB中使用多个分组创建map / reduce索引

2023年9月2日 186次阅读

我们在Raven中存储了一组文档.

public class MyDocument
{
  public string Id { get; set; }
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public string Status { get; set; }
}

我们希望显示由ClientId和DocumentType分组的文档报告,如下所示：

DocumentType  ClientHasManyOfThese Count Action
------------- -------------------- ----- ---------------------
DocumentType1 Yes                  10    LinkToListOfDocuments
DocumentType1 No                   5     LinkToListOfDocuments
DocumentType2 Yes                  12    LinkToListOfDocuments
DocumentType2 No                   15    LinkToListOfDocuments

我创建了以下索引,但它只返回少量文档的正确结果.

public class MyDocumentCount
{
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public int Count { get; set; }
  public bool MultipleDocumentsForClient { get; set; }
}

public class MyIndex : AbstractIndexCreationTask<MyDocument, MyDocumentCount>
{
  public MyIndex()
  {
    Map = tasks => 
      from task in tasks
      where task.Status = "Show In Report"
      select new MyDocumentCount
      {
        DocumentType = task.DocumentType,
        ClientId = task.ClientId,
        MultipleDocumentsForClient = false,
        Count = 1
      };

    Reduce = results =>
      results.GroupBy(result => new 
      {
        result.DocumentType, 
        result.ClientId
      }).Select(conDocGrp => new MyDocumentCount 
      {
        DocumentType = conDocGrp.Key.DocumentType,
        Count = conDocGrp.Sum(result => result.Count),
        MultipleDocumentsForClient = conDocGrp.Sum(result => result.Count) > 1,
        ClientId = conDocGrp.Key.ClientId
      });

    TransformResults = (database, results) =>
      results.GroupBy(result => new
      {
        result.DocumentType,
        result.MultipleDocumentsForClient
      }).Select(multDocGrp => new
      {
        multDocGrp.Key.DocumentType,
        multDocGrp.Key.MultipleDocumentsForClient,
        Count = multDocGrp.Sum(result => int.Parse(result.Count.ToString(CultureInfo.InvariantCulture))),
        ClientId = 0
      });
  }
}

我相信它在调用时与Raven中的结果计数限制有关：

var results = session.Query<MyDocumentCount, MyIndex>().ToList();

也许在执行转换之前将限制应用于索引结果？

谁能告诉我我做错了什么,有没有办法实现我想要的？

我们目前正在运行RavenDB(Server Build 2380).

谢谢.

最佳答案因此,我可以收集的问题的基本要点是,您正在尝试聚合聚合.具体来说,您尝试按ClientId和DocumentType进行分组,然后尝试通过MultipleDocumentsForClient聚合这些结果.您的索引适用于大多数情况,但当Reduce产生的结果超过默认的RavenDB“页面大小”限制时,您无法获得所需的输出.

我确认TransformResults只接收RavenDB的页面限制大小.您可以将TransformResults视为在客户端执行,以确保您以后不会犯任何错误.也许这就是它被弃用的原因,我们应该使用变形金刚.

为了解决你现在的问题,我认为你在一个索引中做得太多了.变换器部分实际上并不用于转换查询结果,而是用于再次聚合.
如果您无法在索引的Reduce部分中进行所有聚合,那么我建议您尝试将索引拆分为两个较小的索引.也许在这种情况下,一个索引可以用于客户端具有多个文档,一个索引可以用于客户端具有单个文档的时间.然后你必须将两个结果加载到内存中,这似乎适合你的情况,因为你已经在你的查询上使用.ToList.