如何利用SQL查询相同的数据？

要查询SQL中相同的数据，可以使用GROUP BY和HAVING子句。，，“sql，SELECT column_name, COUNT(*)，FROM table_name，GROUP BY column_name，HAVING COUNT(*) > 1;，“，，这段代码会返回在指定列中出现次数超过一次的所有数据。

SQL 查询相同的数据

在数据库管理中，有时需要查找表中重复的数据，这可能是为了清理数据、验证数据的完整性，或者进行数据分析，以下将详细介绍如何使用 SQL 查询来查找相同的数据。

一、使用 GROUP BY 和 HAVING 子句查找重复数据

这是最常见的方法之一，通过分组和计数来筛选出重复的数据。

示例表格：`employees`

假设有一个名为employees 的表，结构如下：

id	name	age	department_id
1	Alice	30	1
2	Bob	35	2
3	Charlie	30	1
4	Dave	40	3
5	Eve	30	1

查询语句

SELECT department_id, age, COUNT(*) as count
FROM employees
GROUP BY department_id, age
HAVING COUNT(*) > 1;

解释

SELECT: 选择要显示的列，这里选择了department_id、age 以及计算出来的重复次数count。

FROM: 指定查询的表为employees。

GROUP BY: 按照department_id 和age 进行分组，这样可以对每个部门中相同年龄的员工进行分组统计。

HAVING: 用于过滤分组后的结果，只保留那些重复次数大于 1 的组。

结果

department_id	age	count
1	30	3

这表明在部门 ID 为 1 的部门中，有 3 名员工的年龄是 30 岁，存在重复数据。

二、使用自连接查找重复数据

自连接也是一种常用的方法，通过将表与自身连接来查找重复的数据。

查询语句

SELECT e1.*
FROM employees e1
JOIN employees e2 ON e1.name = e2.name AND e1.id <> e2.id;

解释

SELECT: 选择第一个表（别名为 e1）的所有列。

FROM: 指定主表为employees 并给它一个别名 e1。

JOIN: 将表employees 与自身连接，条件是两个表中的name 列相同，但id 不同，这样就能找到名字重复但记录不同的数据。

结果

id	name	age	department_id
1	Alice	30	1
3	Charlie	30	1
5	Eve	30	1

这显示了名字重复的员工记录，包括他们的其他信息。

三、使用窗口函数查找重复数据

窗口函数可以提供更灵活的查询方式，例如使用ROW_NUMBER() 函数。

查询语句

WITH CTE AS (
    SELECT *,
           ROW_NUMBER() OVER (PARTITION BY name, age ORDER BY id) as row_num
    FROM employees
)
SELECT *
FROM CTE
WHERE row_num > 1;