Как найти повторяющиеся значения в таблице в Oracle?

Question

Как найти повторяющиеся значения в таблице в Oracle?

191

Какой самый простой оператор SQL, который вернет повторяющиеся значения для данного столбца и количество их вхождений в таблице базы данных Oracle?

Например: у меня есть таблица JOBS со столбцом JOB_NUMBER. Как я могу узнать, есть ли у меня дубликат JOB_NUMBER s и сколько раз они дублируются?

Andrew 12 сен. 2008, в 14:57

Источник

1

другие решения stackoverflow.com/questions/4522431/…
zloctb 19 авг. 2015, в 05:56

Теги:

sql

oracle

11 ответов

40

Другой способ:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Работает нормально (достаточно быстро), когда есть индекс на column_name. И это лучший способ удалить или обновить повторяющиеся строки.

Grrey 13 сен. 2008, в 10:44

3

+1 хорошо работает для дубликатов с несколькими столбцами (например, когда вы хотите добавить ограничение UNIQUE для нескольких столбцов), я нашел этот подход менее "жестким", чем метод GROUP BY, чтобы вывести список значений дубликатов полей + другие поля, если это необходимо.
Frosty Z 27 янв. 2012, в 15:05
3

Просто чтобы уточнить (сначала это не было очевидно для меня), этот запрос возвращает только дубликаты, он не возвращает первую исходную запись, поэтому он хорошо работает для удаления дубликатов, основываясь на уникальном ограничении для более чем 1 столбец. С помощью этого запроса вы можете выбрать идентификаторы дубликатов, а затем использовать их для удаления дубликатов.
matthewb 21 нояб. 2012, в 18:26
1

если вы измените <на! =, вы получите все записи, которые дублируются. не только 2-я или 3-я запись
moore1emu 04 янв. 2019, в 19:51

Показать ещё 1 комментарий

25

Проще всего я могу думать:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

JosephStyons 12 сен. 2008, в 15:56

1

Как я могу получить все столбцы?
Asif Mushtaq 26 дек. 2015, в 08:14
2

выберите * из заданий, в которых задан номер задания (выберите задание из группы заданий по номеру задания, имеющему количество (*)> 1)
JosephStyons 26 дек. 2015, в 16:31

12

Вам не нужно даже иметь счет в возвращаемых столбцах, если вам не нужно знать фактическое количество дубликатов. например.

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

Evan 13 сен. 2008, в 15:49

5

Как насчет:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Чтобы ответить на приведенный выше пример, это будет выглядеть так:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

Andrew 12 сен. 2008, в 15:28

4

В случае, когда несколько столбцов идентифицируют уникальную строку (например, таблицу отношений), вы можете использовать следующие

Использовать идентификатор строки например emp_dept (empid, deptid, startdate, enddate) предположим, что empid и deptid уникальны и идентифицируют строку в этом случае

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

и если в такой таблице есть первичный ключ, используйте первичный ключ вместо rowid, например id - pk, затем

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

Jitendra Vispute 20 сен. 2012, в 08:24

0

Хорошая дополнительная информация.
i.am.michiel 15 янв. 2013, в 13:27

3

SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc

Wahid Haidari 05 апр. 2013, в 08:03

3

Выполнение

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

предоставит вам идентификаторы дублированных строк.

agnul 12 сен. 2008, в 17:09

0

Я обычно использую Функция Oracle Analytic ROW_NUMBER().

Предположим, вы хотите проверить дубликаты, которые у вас есть относительно уникального индекса или первичного ключа, построенного на столбцах (c1, c2, c3). Затем вы пройдете этот путь, подняв строки ROWID, где количество строк, приведённых ROW_NUMBER(), равно >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

J. Chomel 24 окт. 2017, в 09:59

0

1. Решение

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

DoOrDie 10 фев. 2016, в 10:31

0

Этот оригинальный постер никогда не упоминал удаление, только подсчет
Jeff 10 фев. 2016, в 15:15

-1

Также вы можете попробовать что-то подобное, чтобы перечислить все повторяющиеся значения в таблице, скажем, reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;

Stacker 27 янв. 2016, в 15:58

Ещё вопросы

другие решения stackoverflow.com/questions/4522431/…
+1 хорошо работает для дубликатов с несколькими столбцами (например, когда вы хотите добавить ограничение UNIQUE для нескольких столбцов), я нашел этот подход менее "жестким", чем метод GROUP BY, чтобы вывести список значений дубликатов полей + другие поля, если это необходимо.
Просто чтобы уточнить (сначала это не было очевидно для меня), этот запрос возвращает только дубликаты, он не возвращает первую исходную запись, поэтому он хорошо работает для удаления дубликатов, основываясь на уникальном ограничении для более чем 1 столбец. С помощью этого запроса вы можете выбрать идентификаторы дубликатов, а затем использовать их для удаления дубликатов.
если вы измените <на! =, вы получите все записи, которые дублируются. не только 2-я или 3-я запись
выберите * из заданий, в которых задан номер задания (выберите задание из группы заданий по номеру задания, имеющему количество (*)> 1)
Хорошая дополнительная информация.
Этот оригинальный постер никогда не упоминал удаление, только подсчет

Bill the Lizard · Accepted Answer · 2008-09-12T15-16-00.000Z

452

Лучший ответ

select column_name, count(column_name)
from table
group by column_name
having count (column_name) > 1;

Bill the Lizard 12 сен. 2008, в 15:16

1

Спасибо - это ответ, который я только что нашел, и ты побил меня, чтобы опубликовать его здесь! : О)
Andrew 12 сен. 2008, в 15:19
3

Пожалуйста. Теперь я собираюсь опубликовать свой собственный вопрос о различиях между количеством (столбец) и количеством (*). :)
Bill the Lizard 12 сен. 2008, в 15:23
2

+1 Это работает и в SQL Server 2005.
LittleTreeX 31 авг. 2011, в 20:44
43

+1 через 4 года, все еще работает хорошо и может быть отрегулирован для выбора нескольких столбцов, если они также находятся в group by , например: select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1; и т.п.
Amos M. Carpenter 24 сен. 2012, в 02:19
4

или даже having count(*) > 1 : D
Stanislav Mamontov 23 март 2015, в 08:43
2

+1 более 8 лет спустя, по-прежнему хорошо работает как для последних версий Oracle, так и для MySQL (убрать пробел после функции count в строке).
PhatHV 19 апр. 2016, в 02:34
0

Этот сценарий всегда мне очень помогает! Спасибо,
Gilberto Galea 09 окт. 2018, в 16:17

Показать ещё 5 комментариев