今天在做统计报表的时候,需要先 group by 对数据分组后,再根据条件对每个分组的数据进行多个条件统计。之前开发时,用的都是简单的 count(*), sum(a) 等计算,第一次根据多个条件进行统计,专门网络搜索了一些资料,本文记录下来,以备后续使用。
准备工作
本文使用的表结构(人员表):
CREATE TABLE `tn_member` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(100) DEFAULT NULL COMMENT '姓名', `sex` int(11) DEFAULT '1' COMMENT '性别', `age` int(11) DEFAULT NULL COMMENT '年龄', `add_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=10 DEFAULT CHARSET=utf8mb4
要实现统计功能:
1. 不区分性别,对年龄区间进行(简单)统计
2. 区分性别,对年龄区间进行(复杂)统计
一、简单的条件统计
实现的原理是,在 count() 或 sum() 等统计方法中,使用 case when 或 if 条件判断,统计最终的结果。
对于本文要实现的功能,sql 语言如下(注意count中的判断):
SELECT COUNT(1) AS '参与统计人数' , COUNT(CASE WHEN age <= 10 THEN 1 ELSE NULL END) AS '年龄 <= 10岁' , COUNT(IF(age > 10 AND age < 12,TRUE,NULL) ) AS '10岁 < 年龄 < 12岁' , COUNT(IF(age >= 12,TRUE,NULL) ) AS '年龄 >= 12岁' FROM tn_member
执行以上 sql 代码,结果如下:
参与统计人数 年龄 <= 10岁 10岁 < 年龄 < 12岁 年龄 >= 12岁 ------------------ --------------- ---------------------- ----------------- 9 5 3 1
二、复杂的group by分组后,条件统计
有了上面简单的条件统计,复杂的 group by 分组统计,实现的方法基本相同,sql 语句如下:
SELECT sex, COUNT(1) AS '参与统计人数' , COUNT(CASE WHEN age <= 10 THEN 1 ELSE NULL END) AS '年龄 <= 10岁' , COUNT(IF(age > 10 AND age < 12,TRUE,NULL) ) AS '10岁 < 年龄 < 12岁' , COUNT(IF(age >= 12,TRUE,NULL) ) AS '年龄 >= 12岁' FROM tn_member GROUP BY sex
执行以上 sql 代码,结果如下:
sex 参与统计人数 年龄 <= 10岁 10岁 < 年龄 < 12岁 年龄 >= 12岁 ------ ------------------ --------------- ---------------------- ----------------- 1 4 2 1 1 2 5 3 2 0
通过上面的简单介绍,可以看出,统计多个条件的记录条数,主要是在 count() 或 sum() 等统计方法中,使用 case when 或 if 等条件判断,统计最终的结果。