google-sheets – 如果唯一的SELECTed列已经在GROUP BY中,为什么我还必须选择聚合列才能使用GROUP BY？

2019年7月28日 218次阅读

在下面的公式使用的数据中,C列包含产品标题列表(这些不是唯一的,许多是空白的);列Q包含每个产品的类别,列F包含该产品的销售额.如果可能的话,我想避免发布任何实际数据(因为它属于我的雇主),但如果认为有必要,我可以用相同的格式模拟一些伪造的行.

我想要做的是生成一个具有最高总销售额的特定类别的非空白产品标题列表,按降序排序,限制为25个条目.

在我看来,以下公式是完全合法的：

=QUERY('Raw Data'!A:Q, "Select C where Q = 'foo' and C != '' group by C order by sum(F) desc limit 25", 1)

但事实并非如此.我收到错误“CANNOT_GROUP_WITHOUT_AGG”.我发现要做到这一点,我需要选择总和(F),如下：

=QUERY('Raw Data'!A:Q, "Select C, sum(F) where Q = 'foo' and C != '' group by C order by sum(F) desc limit 25", 1)

首先,这是为什么？文档(找到here)声明“如果使用group by子句,则select子句中列出的每个列都必须在group by子句中列出,或者由聚合函数包装.”我不明白第一个公式如何不遵守这个标准; select(即只有C)中的每一列都列在group by子句中.

其次,我怎样才能最好地修改这个公式(如果我可以的话)只能选择C？如果我没有做错任何事(可疑,但可能),是否有解决方法,或者我必须处理它？

This question和其他类似的人不回答我的问题 – 我理解如果我想选择多个列,就像我在上面给出的第二个公式中所做的那样,我需要提供一个聚合函数,这样就可以清楚它们是如何分组.但是,在这种情况下,只有一列 – 我只想将它(并且只有它)分组.我在这里遗漏的是什么,不允许这样做？

最佳答案最简单的解决方案可能是围绕第一个包装另一个QUERY公式：

= QUERY(QUERY(‘原始数据’！A：Q,“选择C,求和(F),其中Q =’foo’和C！=”按C顺序除以总和(F)desc limit 25”,1) ,“选择Col1”)