adminqwq管理员

文章48851
浏览1822827

搜索

« 2025年11月 »
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

distinct优化（优化 MySQL 去重DISTINCT vs GROUP BY ）

adminqwq 2026-02-07 社会资讯 14 次浏览 0个评论

前言

在 MySQL 中，DISTINCT 和 GROUP BY 都能实现去重，但平时应该怎么用才能做到效能最高呢？

其实，它们在实现机制、功能定位和性能特征上有着本质区别。

结论

如果只是去重就用 DISTINCT。DISTINCT是SQL专门为去重设计的关键字，它的核心使命很简单：去除重复行，返回唯一值。

如果要分组聚合，只能使用 GROUP BY。GROUP BY的设计初衷就是是对数据进行分组聚合，DISTINCT不具备聚合的能力。

原理对比

DISTINCT执行原理

1. 扫描表数据2. 在内存/临时表中维护已出现的值集合3. 对于每行，检查是否已存在于集合中4. 如果不存在则输出并加入集合5. 如果存在则跳过

GROUP BY执行原理

1. 扫描表数据2. 根据 GROUP BY 列计算哈希值或排序3. 相同分组键的行聚集在一起4. 每组选出一条代表行（不去聚合函数时）性能对比

数据库表

CREATE TABLE `t_user` ( `id` bigint NOT NULL AUTO_INCREMENT COMMENT '主键', `name` varchar(100) NOT NULL COMMENT '姓名', `age` int NOT NULL COMMENT '年龄', PRIMARY KEY (`id`), KEY `idx_age` (`age`)) ENGINE=InnoDB CHARSET=utf8mb4 COMMENT='用户表'

有索引时

两者都使用索引，执行计划相同；性能几乎一样。