SQL中删除重复数据问题-技术圈

点击关注上方“SQL数据库开发”，

设为“置顶或星标”，第一时间送达干货
SQL专栏
SQL基础知识第二版
SQL高级知识第二版

需求分析

数据库中存在重复记录，删除保留其中一条（是否重复判断基准为多个字段）

解决方案

碰到这样的问题我们先分解步骤来看

创建测试数据
找到重复的数据
删除重复的数据并且保留一行

创建测试数据

我们创建一个人员信息表并在里面插入一些重复的数据。

CREATE TABLE [dbo].[Person](
  [ID] [INT] IDENTITY(1,1) NOT NULL,
  [Name] [VARCHAR](20) NULL,
  [Age] [INT] NULL,
  [Address] [VARCHAR](20) NULL,
  [Sex] [CHAR](2) NULL
);

SET IDENTITY_INSERT [dbo].[Person] ON;
INSERT INTO [dbo].[Person] (ID,Name,Age,Address,Sex)
VALUES
( 1, '张三', 18, '北京路18号', '男' ),
( 2, '李四', 19, '北京路29号', '男' ),
( 3, '王五', 19, '南京路11号', '女' ),
( 4, '张三', 18, '北京路18号', '男' ),
( 5, '李四', 19, '北京路29号', '男' ),
( 6, '张三', 18, '北京路18号', '男' ),
( 7, '王五', 19, '南京路11号', '女' ),
( 8, '马六', 18, '南京路19号', '女' );
SET IDENTITY_INSERT [dbo].[Person]  OFF;

(提示：可以左右滑动代码)

建立好测试数据如下：

我们发现除了自增长ID不同以为，有几条其他字段都重复的数据出现，符合我们的需求。

找出重复的数据

SELECT MAX(ID) ID  ,
Name,Age,Address,Sex
FROM dbo.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1

HAVING将分组后统计出来的数量大于1的数据行，就是我们要找的重复数据：

上面用Max函数或者Min函数均可，只是为了保证取出来的数据的唯一性。

删除重复的数据

其实我们数据库中最后要保留的结果就是第二步中查询出来的数据，我们把其他的数据删除即可。怎么删除呢？我们使用ID来排除。

DELETE  FROM Person
WHERE  EXISTS
(
SELECT * FROM (
SELECT 
MAX(ID) ID,
Name,Age,Address,Sex
FROM dbo.Person
GROUP BY Name,Age,Address,Sex
HAVING COUNT(1)>1) T
WHERE Person.Name=T.Name
AND Person.Age=T.Age
AND Person.Address=T.Address
AND Person.Sex=T.Sex
AND Person.ID--如果上面使用MIN函数，这里就要改成>
)

执行完后重新查询Person表结果如下：

马六因为只有一条记录，所以没有参与去重，直接显示。

今天的案例分享结束，小伙伴们可以自己动手尝试一下，兴许工作中也会遇到类似问题。如果你在公众中遇到一些有趣的问题也可以发送给我。


最后给大家分享我写的SQL两件套：《SQL基础知识第二版》和《SQL高级知识第二版》的PDF电子版。里面有各个语法的解释、大量的实例讲解和批注等等，非常通俗易懂，方便大家跟着一起来实操。

有需要的可以下载学习，只需要在下面的公众号「数据前线」(非本号)，后台回复关键字：SQL，就行
数据前线
后台回复关键字：1024，获取一份精心整理的技术干货
后台回复关键字：进群，带你进入高手如云的交流群。

推荐阅读
可怕，中国生育率已经低于日本！
分析一波：中国月入过万的，究竟有多少人？
17 张程序员专属壁纸，使用频率很高
一个员工的离职成本有多恐怖！
为什么腾讯/阿里巴巴不去开发被卡脖子的工业软件？