Как поместить более 1000 значений в предложение Oracle IN

Question

Как поместить более 1000 значений в предложение Oracle IN

78

Есть ли способ обойти ограничение Oracle 10g на 1000 элементов в статическом разделе IN? У меня есть список разделенных запятыми многих идентификаторов, которые я хочу использовать в предложении IN. Иногда этот список может превышать 1000 элементов, после чего Oracle выдает ошибку. Запрос похож на этот...

select * from table1 where ID in (1,2,3,4,...,1001,1002,...)

Aaron Palmer 30 дек. 2008, в 13:19

Источник

0

Какой у вас клиент? .Net, Java ...?
tuinstoel 30 дек. 2008, в 19:27
1

Вы пробовали расширение? т.е. ГДЕ (ID = 1 ИЛИ ID = 2 ....)
TJR 25 сен. 2012, в 01:48
0

Однажды я рассказал эту идею коллеге. Что плохо: регулярно в базе данных выполняются кошмарные запросы (более 1000 операторов OR, сгенерированных приложением). Предложение было бы в таком решении, чтобы ограничить длину списка ...
bdulac 30 июнь 2015, в 08:21
9

@Ben - любопытно, почему вы отметили мой вопрос как дубликат, а не вопрос, который был задан более чем через 2 года после моего.
Aaron Palmer 30 июнь 2015, в 12:08
0

Идет, чтобы показать, насколько пустынно это стало.
Otávio Décio 10 март 2016, в 18:05

Показать ещё 3 комментария

Теги:

oracle

in-clause

11 ответов

43

Вы можете попробовать использовать следующую форму:

select * from table1 where ID in (1,2,3,4,...,1000)
union all
select * from table1 where ID in (1001,1002,...)

rics 30 дек. 2008, в 14:07

2

Когда нет привилегии для создания временной таблицы, это делает супер обходной путь ..
rofans91 12 авг. 2013, в 02:58
0

Не подходит, если вы не знаете, на сколько тысяч ценностей раньше времени. Например, если есть 3005 значений, будет объединено 4 предложения выбора.
emily 14 июнь 2018, в 17:04
0

Я работаю над консолью C #, этот способ довольно хорош на самом деле. Мне просто нужно посчитать количество значений, взять тысячу цифр и - 1, а затем динамически добавлять номера строк заранее.
Rozen 10 янв. 2019, в 22:07

Показать ещё 1 комментарий

36

Я почти уверен, что вы можете разделить значения на несколько IN с помощью OR:

select * from table1 where ID in (1,2,3,4,...,1000) or 
ID in (1001,1002,...,2000)

Peter Severin 31 дек. 2008, в 12:29

8

Максимальное количество значений в предложении IN - это одно из тех ограничений, которыми вы никогда не должны ограничиваться.
erikkallen 31 дек. 2008, в 11:23
3

Это можно сделать, но это означает, что Oracle каждый раз видит разные запросы, а это требует много сложного анализа, что замедляет работу.
tuinstoel 31 дек. 2008, в 11:30
1

Мне нравится это решение, некоторые другие, опубликованные здесь, требуют слишком много усилий!
TrojanName 01 нояб. 2012, в 09:51
0

Но если у него есть 2000 значений, как он будет вставлять в временную таблицу за один удар по БД? Это лучше написать немного логики и разделить на 1000, 1000 записей и создать динамический запрос.
Samurai 05 март 2013, в 14:50
0

Существует понятие, называемое временной таблицей. У нас такие же требования. Где мы - промежуточное программное обеспечение, имеющее определенные данные, и клиент запрашивает идентификаторы Say 1000+ одновременно. Таким образом, для каждого запроса мы создаем временную таблицу, пакетно вставляем список идентификаторов (мы делаем это с использованием JPA, и для этого не требуется много кода), затем соединяем эти идентификаторы временной таблицы с фактическими данными таблиц.
napster 10 март 2017, в 11:29

Показать ещё 3 комментария

15

select column_X, ... from my_table
where ('magic', column_X ) in (
        ('magic', 1),
        ('magic', 2),
        ('magic', 3),
        ('magic', 4),
             ...
        ('magic', 99999)
    ) ...

Sergey11g 10 июнь 2013, в 09:20

1

Как это работает?
Matthew Moisen 14 сен. 2016, в 18:44
2

Поскольку Oracle просто так (шокирует?), Вы не поверите, пока не попробуете и не увидите, что это работает! Это лучше, чем создавать временную таблицу, особенно если вы хорошо работаете с vi / vim / subl.
LAK 05 май 2017, в 03:56
1

У меня нет слов. Нет ошибки в самом запросе, но я получил ORA-12609 после 5-минутного ограничения recv_timeout. Есть ли слово для того, чтобы быть шокированным, но совсем не удивленным?
JP Duffy 19 июль 2017, в 17:27
2

Вот Это Да! не мог поверить, что это действительно сработает, но это работает.
Anurag 13 нояб. 2017, в 07:31
2

Это работает, потому что это многозначный список сравнения. Oracle внедрил этот список IN для сравнения нескольких значений с пределом <100 000 вместо 1000 в обычном списке IN. Таким образом, первое значение val1 является «магическим», это также мог быть столбец. Второе значение val2 является столбцом. Таким образом, значения в списке IN - это значения, которым должны соответствовать val1 и val2. Таким образом, val1 должен равняться input1, а val2 должен равняться input 2. Поскольку val1 и input1 жестко закодированы как «волшебные», мы можем просто рассматривать это как обычный список IN, но с пределом 100 000, а не 1000.
cody.tv.weber 19 март 2018, в 19:44
0

Это хорошо для Единой производственной среды по Производственным вопросам.
cody.tv.weber 19 март 2018, в 19:58
0

немного опоздал, но при этом заметил, что стоимость объяснения плана объяснения увеличивается линейно с числом ('magic',: para1). это ухудшает производительность?
Tim 22 март 2019, в 22:13

Показать ещё 5 комментариев

8

Откуда вы получаете список идентификаторов от первого места? Поскольку они являются идентификаторами в вашей базе данных, они были получены из предыдущего запроса?

Когда я видел это в прошлом, это было потому, что: -

отсутствует ссылочная таблица, и правильным способом было бы добавить новую таблицу, поместить атрибут в эту таблицу и присоединиться к ней.
список идентификаторов извлекается из базы данных, а затем используется в последующих операциях SQL (возможно, позже или на другом сервере или что-то еще). В этом случае ответ заключается в том, чтобы никогда не извлекать его из базы данных. Либо хранить во временной таблице, либо просто написать один запрос.

Я думаю, что могут быть лучшие способы переделать этот код, чтобы просто заставить этот оператор SQL работать. Если вы предоставите более подробную информацию, вы можете получить некоторые идеи.

WW. 31 дек. 2008, в 11:52

1

Отличные вопросы! Я часто использую технику массива, которую я уже опубликовал, но я использую ее, когда пользователь вручную выбрал несколько строк в сетке данных пользовательского интерфейса. Однако маловероятно, что пользователь выберет> 1000 строк вручную.
tuinstoel 31 дек. 2008, в 10:52

5

Использовать... из таблицы (...:

create or replace type numbertype
as object
(nr number(20,10) )
/ 

create or replace type number_table
as table of numbertype
/ 

create or replace procedure tableselect
( p_numbers in number_table
, p_ref_result out sys_refcursor)
is
begin
  open p_ref_result for
    select *
    from employees , (select /*+ cardinality(tab 10) */ tab.nr from table(p_numbers) tab) tbnrs 
    where id = tbnrs.nr; 
end; 
/

Это один из редких случаев, когда вам нужен намек, иначе Oracle не будет использовать индекс для идентификатора столбца. Одно из преимуществ этого подхода заключается в том, что Oracle не нуждается в жестком анализе запроса снова и снова. Использование временной таблицы в большинстве случаев медленнее.

изменить 1 упростить процедуру (спасибо jimmyorr) + пример

create or replace procedure tableselect
( p_numbers in number_table
, p_ref_result out sys_refcursor)
is
begin
  open p_ref_result for
    select /*+ cardinality(tab 10) */ emp.*
    from  employees emp
    ,     table(p_numbers) tab
    where tab.nr = id;
end;
/

Пример:

set serveroutput on 

create table employees ( id number(10),name varchar2(100));
insert into employees values (3,'Raymond');
insert into employees values (4,'Hans');
commit;

declare
  l_number number_table := number_table();
  l_sys_refcursor sys_refcursor;
  l_employee employees%rowtype;
begin
  l_number.extend;
  l_number(1) := numbertype(3);
  l_number.extend;
  l_number(2) := numbertype(4);
  tableselect(l_number, l_sys_refcursor);
  loop
    fetch l_sys_refcursor into l_employee;
    exit when l_sys_refcursor%notfound;
    dbms_output.put_line(l_employee.name);
  end loop;
  close l_sys_refcursor;
end;
/

Это выведет:

Raymond
Hans

tuinstoel 30 дек. 2008, в 15:25

3

Я оказался здесь, ища решение.

В зависимости от высокого количества элементов, с которыми вам нужно запросить, и если ваши объекты уникальны, вы можете разделить запрос на пакетные запросы из 1000 элементов и вместо этого комбинировать результаты на своем конце (здесь псевдокод):

//remove dupes
items = items.RemoveDuplicates();

//how to break the items into 1000 item batches        
batches = new batch list;
batch = new batch;
for (int i = 0; i < items.Count; i++)
{
    if (batch.Count == 1000)
    {
        batches.Add(batch);
        batch.Clear()
    }
    batch.Add(items[i]);
    if (i == items.Count - 1)
    {
        //add the final batch (it has < 1000 items).
        batches.Add(batch); 
    }
}

// now go query the db for each batch
results = new results;
foreach(batch in batches)
{
    results.Add(query(batch));
}

Это может быть хорошим компромиссом в сценарии, в котором обычно не более 1000 элементов, поскольку более 1000 элементов будут вашим "крайним" краевым сценарием. Например, если у вас есть 1500 элементов, два запроса (1000, 500) не так уж плохи. Это также предполагает, что каждый запрос не является особенно дорогостоящим по своему усмотрению.

Это было бы нецелесообразно, если бы ваше типичное количество ожидаемых предметов стало намного больше - скажем, в диапазоне 100000 - требуется 100 запросов. Если да, то вам, вероятно, следует более серьезно относиться к использованию решения глобальных временных таблиц, представленного выше, как наиболее "правильное" решение. Кроме того, если ваши объекты не уникальны, вам также необходимо будет разрешить дублировать результаты в ваших партиях.

Mike Atlas 03 авг. 2009, в 20:32

1

Он, мое решение более правильное :) Нет необходимости во временной таблице.
tuinstoel 03 авг. 2009, в 19:49
0

правильное мышление, код немного слишком шаблонно, хотя. мы используем Lists.partition () из Google-коллекций, чтобы сделать это почти однострочно
Andreas Petersson 15 авг. 2009, в 09:23
0

Я не вижу никакого преимущества. Если вы не хотите использовать коллекцию Oracle или временную таблицу, используйте решение Питера Северина. Решение Питера Северина приводит к меньшему количеству обращений к базе данных и меньшему разбору, чем это решение. Также проще в клиенте, потому что у вас есть только одна партия.
tuinstoel 15 авг. 2009, в 09:55
0

Я хотел бы иметь метод / функцию .Partition () =)
Mike Atlas 16 авг. 2009, в 15:27

Показать ещё 2 комментария

1

Да, очень странная ситуация для оракула.

если вы укажете 2000 идентификаторов внутри предложения IN, он завершится с ошибкой. это не удается:

select ... 
where id in (1,2,....2000)

но если вы просто поместите идентификаторы 2000 в другую таблицу (например, таблицу temp), она будет работать это работает:

select ... 
where id in (select userId 
             from temptable_with_2000_ids )

что вы можете сделать, на самом деле можно разделить записи на много 1000 записей и выполнить их по группам.

Aaron He 08 май 2013, в 20:37

0

Вот какой-то код Perl, который пытается обойти ограничения, создав встроенное представление, а затем выбрав его. Текст инструкции сжимается, используя строки из двенадцати элементов каждый, вместо того, чтобы выбирать каждый элемент из DUAL отдельно, а затем несжатый путем объединения всех столбцов. UNION или UNION ALL в декомпрессии не должны иметь никакого значения здесь, поскольку все это входит внутрь IN, который наложит уникальность, прежде чем присоединяться к нему в любом случае, но в сжатии UNION ALL используется для предотвращения большого количества ненужного сравнения. Поскольку данные, которые я фильтрую, являются целыми числами, цитирование не является проблемой.

#
# generate the innards of an IN expression with more than a thousand items
#
use English '-no_match_vars';
sub big_IN_list{
    @_ < 13 and return join ', ',@_;
    my $padding_required = (12 - (@_ % 12)) % 12;  
    # get first dozen and make length of @_ an even multiple of 12
    my ($a,$b,$c,$d,$e,$f,$g,$h,$i,$j,$k,$l) = splice @_,0,12, ( ('NULL') x $padding_required );

    my @dozens; 
    local $LIST_SEPARATOR = ', '; # how to join elements within each dozen
    while(@_){
        push @dozens, "SELECT @{[ splice @_,0,12 ]} FROM DUAL"
    };  
    $LIST_SEPARATOR = "\n    union all\n    "; # how to join @dozens 
    return <<"EXP";
WITH t AS (
    select $a A, $b B, $c C, $d D, $e E, $f F, $g G, $h H, $i I, $j J, $k K, $l L FROM     DUAL
    union all
    @dozens
 )
select A from t union select B from t union select C from t union
select D from t union select E from t union select F from t union
select G from t union select H from t union select I from t union 
select J from t union select K from t union select L from t
EXP
}

Можно использовать так:

my $bases_list_expr = big_IN_list(list_your_bases());
$dbh->do(<<"UPDATE");
    update bases_table set belong_to = 'us'
    where whose_base in ($bases_list_expr)
UPDATE

Never Sleep Again 30 май 2014, в 19:04

0

Вместо использования предложения IN вы можете попробовать использовать JOIN с другой таблицей, которая извлекает идентификатор. таким образом нам не нужно беспокоиться о лимите. просто мысль с моей стороны.

Raju 01 авг. 2012, в 14:05

0

Я вижу, что это был ваш первый ответ на вопрос, поэтому у вас не было представителя, который бы опубликовал это как комментарий, но в будущем вы можете подумать о том, чтобы опубликовать это как комментарий. Предполагается, что ответы - это решение проблемы, которое, как вы уверены, решит проблему.
Fluffeh 28 сен. 2012, в 10:31
0

Это не решит проблему. Объединения выберут все записи, но не выберут один или два элемента, выбранных в предложении IN.
PHPGuru 19 нояб. 2014, в 02:18

-3

Вместо SELECT * FROM table1 WHERE ID IN (1,2,3,4,...,1000);

Используйте это:

SELECT * FROM table1 WHERE ID IN (SELECT rownum AS ID FROM dual connect BY level <= 1000);

* Обратите внимание, что вам нужно убедиться, что идентификатор не ссылается на другие внешние IDS, если это зависимость. Чтобы обеспечить доступность только существующих идентификаторов, выполните следующие действия:

SELECT * FROM table1 WHERE ID IN (SELECT distinct(ID) FROM tablewhereidsareavailable);

Приветствия

mousetwentytwo 14 июнь 2012, в 16:46

Ещё вопросы

Вы пробовали расширение? т.е. ГДЕ (ID = 1 ИЛИ ID = 2 ....)
Однажды я рассказал эту идею коллеге. Что плохо: регулярно в базе данных выполняются кошмарные запросы (более 1000 операторов OR, сгенерированных приложением). Предложение было бы в таком решении, чтобы ограничить длину списка ...
@Ben - любопытно, почему вы отметили мой вопрос как дубликат, а не вопрос, который был задан более чем через 2 года после моего.
Идет, чтобы показать, насколько пустынно это стало.
Когда нет привилегии для создания временной таблицы, это делает супер обходной путь ..
Не подходит, если вы не знаете, на сколько тысяч ценностей раньше времени. Например, если есть 3005 значений, будет объединено 4 предложения выбора.
Я работаю над консолью C #, этот способ довольно хорош на самом деле. Мне просто нужно посчитать количество значений, взять тысячу цифр и - 1, а затем динамически добавлять номера строк заранее.
Максимальное количество значений в предложении IN - это одно из тех ограничений, которыми вы никогда не должны ограничиваться.
Это можно сделать, но это означает, что Oracle каждый раз видит разные запросы, а это требует много сложного анализа, что замедляет работу.
Мне нравится это решение, некоторые другие, опубликованные здесь, требуют слишком много усилий!
Но если у него есть 2000 значений, как он будет вставлять в временную таблицу за один удар по БД? Это лучше написать немного логики и разделить на 1000, 1000 записей и создать динамический запрос.
Существует понятие, называемое временной таблицей. У нас такие же требования. Где мы - промежуточное программное обеспечение, имеющее определенные данные, и клиент запрашивает идентификаторы Say 1000+ одновременно. Таким образом, для каждого запроса мы создаем временную таблицу, пакетно вставляем список идентификаторов (мы делаем это с использованием JPA, и для этого не требуется много кода), затем соединяем эти идентификаторы временной таблицы с фактическими данными таблиц.
Поскольку Oracle просто так (шокирует?), Вы не поверите, пока не попробуете и не увидите, что это работает! Это лучше, чем создавать временную таблицу, особенно если вы хорошо работаете с vi / vim / subl.
У меня нет слов. Нет ошибки в самом запросе, но я получил ORA-12609 после 5-минутного ограничения recv_timeout. Есть ли слово для того, чтобы быть шокированным, но совсем не удивленным?
Вот Это Да! не мог поверить, что это действительно сработает, но это работает.
Это работает, потому что это многозначный список сравнения. Oracle внедрил этот список IN для сравнения нескольких значений с пределом <100 000 вместо 1000 в обычном списке IN. Таким образом, первое значение val1 является «магическим», это также мог быть столбец. Второе значение val2 является столбцом. Таким образом, значения в списке IN - это значения, которым должны соответствовать val1 и val2. Таким образом, val1 должен равняться input1, а val2 должен равняться input 2. Поскольку val1 и input1 жестко закодированы как «волшебные», мы можем просто рассматривать это как обычный список IN, но с пределом 100 000, а не 1000.
Это хорошо для Единой производственной среды по Производственным вопросам.
немного опоздал, но при этом заметил, что стоимость объяснения плана объяснения увеличивается линейно с числом ('magic',: para1). это ухудшает производительность?
Отличные вопросы! Я часто использую технику массива, которую я уже опубликовал, но я использую ее, когда пользователь вручную выбрал несколько строк в сетке данных пользовательского интерфейса. Однако маловероятно, что пользователь выберет> 1000 строк вручную.
Он, мое решение более правильное :) Нет необходимости во временной таблице.
правильное мышление, код немного слишком шаблонно, хотя. мы используем Lists.partition () из Google-коллекций, чтобы сделать это почти однострочно
Я не вижу никакого преимущества. Если вы не хотите использовать коллекцию Oracle или временную таблицу, используйте решение Питера Северина. Решение Питера Северина приводит к меньшему количеству обращений к базе данных и меньшему разбору, чем это решение. Также проще в клиенте, потому что у вас есть только одна партия.
Я хотел бы иметь метод / функцию .Partition () =)
Я вижу, что это был ваш первый ответ на вопрос, поэтому у вас не было представителя, который бы опубликовал это как комментарий, но в будущем вы можете подумать о том, чтобы опубликовать это как комментарий. Предполагается, что ответы - это решение проблемы, которое, как вы уверены, решит проблему.
Это не решит проблему. Объединения выберут все записи, но не выберут один или два элемента, выбранных в предложении IN.

Otávio Décio · Accepted Answer · 2008-12-30T14-30-00.000Z

79

Лучший ответ

Поместите значения во временную таблицу, а затем выполните выбор, где находится id (выберите id из искушаемого)

Otávio Décio 30 дек. 2008, в 14:30

7

Лично я поместил бы значения во временную таблицу и использовал бы JOIN для запроса значений. Я не знаю, действительно ли это лучшая производительность или нет.
Neil Barnwell 30 дек. 2008, в 14:17
0

@Neil Barnwell - я думаю, что любой приличный движок SQL оптимизировал бы так, чтобы IN и JOIN имели почти одинаковую производительность. Использование IN, по крайней мере, для меня яснее по своему намерению.
Otávio Décio 30 дек. 2008, в 14:37
18

@ocdecio - мои тесты с Oracle 10g показывают разные (и явно хуже) планы объяснения IN, по сравнению с JOIN. Лично я бы использовал JOIN и рекомендовал бы другим тестировать разные подходы, чтобы увидеть различия в производительности, а не догадываться.
jimmyorr 03 авг. 2009, в 19:59
0

@jimmyorr - спасибо, что нашли время, чтобы проверить производительность, хотя ОП не выглядела слишком озабоченной этим.
Otávio Décio 05 авг. 2009, в 17:54
0

Обычно IN и JOIN происходят из-за возможности NULLS в списке IN.
WW. 18 окт. 2010, в 12:09
2

Но если у него есть 2000 значений, как он будет вставлять в временную таблицу за один удар по БД? Это лучше написать некоторую логику и разделить на 1000, 1000 записей и создать динамический запрос, как сказал Питер Северин select * from table1, где ID в (1,2,3,4, ..., 1000) или ID в (1001, 1002, ..., 2000) ..
Samurai 05 март 2013, в 14:52
1

Используйте эту технику, чтобы получить хорошую производительность при массовых вставках во временную таблицу: stackoverflow.com/questions/7195665/… . Этот метод принес 30-секундный запрос на 1 секунду в моем тестировании.
jmh 22 май 2014, в 17:17
2

Я не могу создавать временные таблицы на производстве. Большие пальцы вниз
GabrielBB 18 окт. 2016, в 12:48
1

В общем, когда вы видите такой большой список, это индикатор недостатка дизайна, например отсутствующего объекта.
BobC 06 янв. 2017, в 05:56

Показать ещё 7 комментариев