MySQL分组查询与聚合函数的使用方法(三)
上节课我们介绍了MySQL数据写入与where条件查询的基本方法,具体可回顾 MySQL数据插入INSERT INTO与条件查询WHERE的基本用法(二) 。本节课我们介绍MySQL分组查询与聚合函数的使用方法。
1
GROUP BY分组查询
在 MySQL 中, GROUP BY 关键字可以根据一个或多个字段对查询结果进行分组。
使用 GROUP BY 关键字的基本语法格式如下:
SELECT <字段名>,(聚合函数)
FROM 表名
GROUP BY <字段名>
其中,“字段名”表示需要分组的字段名称,多个字段时用逗号隔开。
【任务1】我们根据性别分别统计生存人数占比,可以使用GROUP BY分组查询进行统计。
select sex,sum(survived)/count(1) as survived_rate
from titanic
GROUP by sex ;
得到最终的查询结果如下
根据查询结果可以看到,男性最终的生存比例为18.89%,女性的生存比例为74.2%,说明女性在此次泰坦尼克号沉船事件中获救比例更高。
【任务2】统计各性别和船舱等级的生存比例,这时就需要使用GROUP BY对性别和船舱等级两个字段进行分组查询。
select sex,pclass,sum(survived)/count(1) as survived_rate
from titanic
GROUP by sex,pclass
;
得到最终的查询结果如下
说明男性且船舱等级为3的乘客生存比例最低,仅为13.54%,女性且船舱等级为1的乘客生存比例最高,为96.81%。
【任务3】统计年龄为30岁,各性别和船舱等级的生存比例,这时候就需要通过where关键字先进行条件筛选,最后再通过GROUP BY分组统计。
select sex,pclass,sum(survived)/count(1) as survived_rate
from titanic
where age=30
GROUP by sex,pclass
最终查询结果如下
说明30岁的乘客中,女性且船舱等级为1的乘客生存比例为100%,而男性且船舱等级为1和2的乘客生存比例均为0。
2
聚合函数
聚合函数(aggregation function)表示在分组基础进行数据统计,得到每组的统计结果的一种操作。 例如,前面提到的对每个性别的生存概率统计也使用到聚合函数。在MySQL中,常用的聚合函数包括以下几种。
函数名 |
作用 |
---|---|
MAX(column) |
返回某列的最大值(有则不会返回NULL,没有则返回NULL |
MIN(column) |
返回某列的最小值(没有则返回NULL |
COUNT(column) |
返回某列的行数(不包括 NULL 值) |
SUM(column) 求和 |
返回某列的和(不包括 NULL 值) |
AVG(column) 求平均值 |
返回某列的平均值(不包括 NULL 值) |
【任务4】找出是否生存乘客中各自最大的年龄,可以使用GROUP BY分组以及聚合函数MAX进行统计。
select survived,max(age)
FROM titanic
GROUP by survived
;
统计结果如下
说明幸存者中乘客最大的年龄为80岁,而死亡者中年龄最大者为74岁。
【任务5】统计出男女幸存乘客的总人数,可以通过where条件查询以及COUNT统计函数进行统计。
select sex,count(survived)
FROM titanic