Postgres: INSERT, если еще не существует

Question

Postgres: INSERT, если еще не существует

193

Я использую Python для записи в базу данных postgres:

sql_string = "INSERT INTO hundred (name,name_slug,status) VALUES ("
sql_string += hundred + ", '" + hundred_slug + "', " + status + ");"
cursor.execute(sql_string)

Но поскольку некоторые из моих строк идентичны, я получаю следующую ошибку:

psycopg2.IntegrityError: duplicate key value  
  violates unique constraint "hundred_pkey"

Как я могу написать "INSERT, если эта строка уже не существует" SQL-выражение?

Я видел сложные инструкции, как это рекомендуется:

IF EXISTS (SELECT * FROM invoices WHERE invoiceid = '12345')
UPDATE invoices SET billed = 'TRUE' WHERE invoiceid = '12345'
ELSE
INSERT INTO invoices (invoiceid, billed) VALUES ('12345', 'TRUE')
END IF

Но во-первых, это лишний для того, что мне нужно, а во-вторых, как я могу выполнить одну из них как простую строку?

AP257 01 нояб. 2010, в 13:22

Источник

45

Независимо от того, как вы решаете эту проблему, вы не должны генерировать свой запрос таким образом. Используйте параметры в своем запросе и передавайте значения отдельно; см. stackoverflow.com/questions/902408/…
Thomas Wouters 01 нояб. 2010, в 14:36
3

Почему бы не поймать исключение и игнорировать его?
Matthew Mitchell 31 март 2015, в 19:42
4

Начиная с Posgres 9.5 (в настоящее время на бета2) появилась новая функция, похожая на upsert, см. Postgresql.org/docs/9.5/static/sql-insert.html#SQL-ON-CONFLICT
Ezequiel Moreno 11 нояб. 2015, в 14:08
1

Рассматривали ли вы принять ответ на это? знак равно
Relequestual 02 дек. 2015, в 14:34

Показать ещё 2 комментария

Теги:

python

postgresql

sql-insert

15 ответов

Ещё вопросы

Независимо от того, как вы решаете эту проблему, вы не должны генерировать свой запрос таким образом. Используйте параметры в своем запросе и передавайте значения отдельно; см. stackoverflow.com/questions/902408/…
Почему бы не поймать исключение и игнорировать его?
Начиная с Posgres 9.5 (в настоящее время на бета2) появилась новая функция, похожая на upsert, см. Postgresql.org/docs/9.5/static/sql-insert.html#SQL-ON-CONFLICT
Рассматривали ли вы принять ответ на это? знак равно

John Doe · Answer 1 · 2012-11-12T12-00-00.000Z

289

Как я могу написать "INSERT, если эта строка уже не существует" SQL-выражение?

Есть хороший способ сделать условный INSERT в PostgreSQL:

INSERT INTO example_table
    (id, name)
SELECT 1, 'John'
WHERE
    NOT EXISTS (
        SELECT id FROM example_table WHERE id = 1
    );

CAVEAT. Этот подход не является на 100% надежным для одновременных операций записи. Между SELECT существует очень крошечное состояние гонки в анти-полусоединении NOT EXISTS и самом INSERT. В таких условиях он может выйти из строя.

John Doe 12 нояб. 2012, в 12:00

0

Насколько это безопасно, если предположить, что поле «name» имеет УНИКАЛЬНОЕ ограничение? Это когда-нибудь потерпит неудачу с уникальным нарушением?
agnsaft 29 дек. 2012, в 19:57
0

@invictus Если какой-то другой новый идентификатор будет совпадать с именем, которое уже есть в базе данных, я думаю, что это не получится, это было бы очевидным поведением.
John Doe 03 янв. 2013, в 17:22
1

Вроде тоже работает в 8.4.11
rapto 05 сен. 2013, в 09:07
2

Это отлично работает. Думаю, единственная проблема - это связь: что, если один из них модифицирует таблицу так, чтобы больше столбцов были уникальными. В этом случае все сценарии должны быть изменены. Было бы неплохо, если бы был более общий способ сделать это ...
Willem Van Onsem 01 авг. 2014, в 13:17
0

Есть ли способ сделать это при указании имен столбцов?
sudo 12 авг. 2015, в 02:06
0

@JohnDoe Так как этот запрос не на 100% гарантированно безопасен для одновременной записи, как он соотносится с решением, если я пишу два запроса: один SELECT для поиска, если строка существует, и один INSERT для вставки, если он не существует в одной транзакции?
tonga 01 сен. 2015, в 15:00
0

В большинстве случаев я считаю, что мы используем серийные идентификаторы, поэтому идентификатор не будет включен в предложение вставки. Как бы это изменило запрос?
Rodrigo 23 дек. 2015, в 21:22
1

Можно ли использовать его с RETURNS id например, чтобы получить id ли он вставлен или нет?
Olivier Pons 03 янв. 2016, в 10:58
2

@OlivierPons да, это возможно. Добавьте RETURNING id в запросе и в запросе, и он вернет либо новый идентификатор строки, либо ничего, если строка не была вставлена.
AlexM 15 фев. 2016, в 10:08
0

Это всего лишь доброе напоминание: если кто-то хочет избежать условий гонки, ему лучше не использовать этот ответ. Пожалуйста, обратитесь к ответу со вторым голосом (от Arie).
AnnieFromTaiwan 22 апр. 2017, в 09:14
0

Я обнаружил, что это ненадежно. Похоже, что Postgres иногда выполняет вставку до того, как он выполнил операцию выбора, и в результате я получаю нарушение ключа-дубликата, хотя запись еще не была вставлена. Попробуйте использовать версию => 9.5 с ON CONFLICT.
Michael Silver 28 май 2017, в 02:38
0

Этот вариант работал очень хорошо для моих нужд. Спасибо!
Daniel Silva 07 авг. 2018, в 20:29
0

Я хотел вставить более 1 строки и использовал ваш код, как этот INSERT INTO example_table (id, name) SELECT 1, 'John' WHERE EXISTS (SELECT id FROM example_table WHERE id = 1) UNION SELECT 2, 'Smith' WHERE NOT EXISTS (ВЫБЕРИТЕ id ИЗ example_table WHERE id = 2) в Postgres 9.2. Будет ли важно состояние гонки, если я попытаюсь сделать это для сотни заявок?
Ratah 30 авг. 2018, в 08:17

Показать ещё 11 комментариев

Arie · Answer 2 · 2015-07-31T11-04-00.000Z

166

Postgres 9.5 (выпущен с 2016-01-07) предлагает команду "upsert" , также известную как Включение CONFLICT в INSERT:

INSERT ... ON CONFLICT DO NOTHING/UPDATE

Он решает многие из тонких проблем, с которыми вы можете столкнуться при использовании параллельной операции, которую предлагают некоторые другие ответы.

Arie 31 июль 2015, в 11:04

12

9,5 вышел.
luckydonald 25 янв. 2016, в 16:38
0

Как сделать что-то вроде этого (Обновление о конфликте) на Postgres 9.3?
Tushar Jain 24 дек. 2016, в 02:59
0

Руководство Postgres 9.3 описывает, как вы можете создать функцию, используя для этого исключения. Несколько других реализаций можно найти в Интернете. Это, по-видимому, очень сложно, хотя правильно разобраться с транзакциями и другими делами ...
Arie 25 дек. 2016, в 12:31
2

@TusharJain до PostgreSQL 9.5 вы можете сделать «старомодный» UPSERT (с CTE), но у вас могут возникнуть проблемы с условиями гонки, и он не будет работать как стиль 9.5. В этом блоге есть хорошая информация об upsert (в обновленной области внизу), включая некоторые ссылки, если вы хотите узнать больше о деталях.
Skyguard 01 апр. 2017, в 16:03
6

Для тех, кто нуждается, вот два простых примера. (1) ВСТАВИТЬ, если не существует, иначе НИЧЕГО - INSERT INTO distributors (did, dname) VALUES (7, 'Redline GmbH') ON CONFLICT (did) DO NOTHING; (2) INSERT, если не существует, иначе UPDATE - INSERT INTO distributors (did, dname) VALUES (5, 'Gizmo Transglobal'), (6, 'Associated Computing, Inc') ON CONFLICT (did) DO UPDATE SET dname = EXCLUDED.dname; Эти примеры взяты из руководства - postgresql.org/docs/9.5/static/sql-insert.html.
AnnieFromTaiwan 22 апр. 2017, в 09:10
6

Есть одно предостережение / побочный эффект. В таблице со столбцом последовательности (последовательный или большой), даже если строка не вставлена, последовательность увеличивается при каждой попытке вставки.
Grzegorz Luczywo 02 июль 2017, в 12:10
2

Было бы лучше ссылаться на документацию INSERT, а не указывать на выпуск. Ссылка на документ: postgresql.org/docs/9.5/static/sql-insert.html
borjagvo 03 нояб. 2017, в 07:36
0

Обратите внимание, что вы не можете сделать ON CONFLICT DO SELECT .
Gajus 22 окт. 2018, в 15:44
1

Если вам нужно, чтобы ON CONFLICT DO NOTHING RETURNING id , прочитайте этот ответ stackoverflow.com/a/42217872/368691 .
Gajus 22 окт. 2018, в 15:57
0

Теперь существует метод SQL-алхимии, который можно использовать при конфликте, ничего не делая, возможно, следуя совету от stackoverflow.com/a/42217872/368691
MrMesees 06 дек. 2018, в 23:51
0

@AnnieFromTaiwan мне бы помогло, чтобы вы обновили вопрос своими примерами! не хотел получать кредиты для вас!
Pipo 10 март 2019, в 12:45

Показать ещё 9 комментариев

Kuberchaun · Answer 3 · 2010-11-01T15-47-00.000Z

Одним из подходов было бы создание таблицы без ограничений (без уникальных индексов) для вставки всех ваших данных и выбора, отличного от того, чтобы вставить вашу стоп-таблицу в сто таблицу.

Такой высокий уровень. Я предполагаю, что все три столбца отличаются в моем примере, поэтому для шага 3 измените соединение NOT EXITS, чтобы присоединиться только к уникальным столбцам в сто таблице.

Создайте временную таблицу. См. Docs здесь.
```
CREATE TEMPORARY TABLE temp_data(name, name_slug, status);
```

INSERT Данные в таблицу temp.

INSERT INTO temp_data(name, name_slug, status);

Добавьте любые индексы в таблицу temp.

Введите основную таблицу.

INSERT INTO hundred(name, name_slug, status) 
    SELECT DISTINCT name, name_slug, status
    FROM hundred
    WHERE NOT EXISTS (
        SELECT 'X' 
        FROM temp_data
        WHERE 
            temp_data.name          = hundred.name
            AND temp_data.name_slug = hundred.name_slug
            AND temp_data.status    = status
    );

Это самый быстрый способ сделать массовые вставки, когда я не знаю, существует ли уже строка.
выберите «Х»? кто-нибудь может уточнить? Это просто оператор выбора справа: SELECT name,name_slug,status или *
Найти коррелированный подзапрос. «X» может быть изменено на 1 или даже «SadClown». SQL требует, чтобы что-то было, а «X» - обычное дело. Он небольшой и делает очевидным, что используется коррелированный подзапрос и соответствует требованиям того, что требует SQL.

Quassnoi · Answer 4 · 2010-11-01T15-30-00.000Z

К сожалению, PostgreSQL не поддерживает ни MERGE, ни ON DUPLICATE KEY UPDATE, поэтому вам нужно сделать это в двух утверждениях:

UPDATE  invoices
SET     billed = 'TRUE'
WHERE   invoices = '12345'

INSERT
INTO    invoices (invoiceid, billed)
SELECT  '12345', 'TRUE'
WHERE   '12345' NOT IN
        (
        SELECT  invoiceid
        FROM    invoices
        )

Вы можете включить его в функцию:

CREATE OR REPLACE FUNCTION fn_upd_invoices(id VARCHAR(32), billed VARCHAR(32))
RETURNS VOID
AS
$$
        UPDATE  invoices
        SET     billed = $2
        WHERE   invoices = $1;

        INSERT
        INTO    invoices (invoiceid, billed)
        SELECT  $1, $2
        WHERE   $1 NOT IN
                (
                SELECT  invoiceid
                FROM    invoices
                );
$$
LANGUAGE 'sql';

и просто назовите его:

SELECT  fn_upd_invoices('12345', 'TRUE')

На самом деле, это не работает: я могу позвонить INSERT INTO hundred (name, name_slug, status) SELECT 'Chichester', 'chichester', NULL WHERE 'Chichester' NOT IN (SELECT NAME FROM hundred); любое количество раз, и он продолжает вставлять строку.
@ AP257: CREATE TABLE hundred (name TEXT, name_slug TEXT, status INT); INSERT INTO hundred (name, name_slug, status) SELECT 'Chichester', 'chichester', NULL WHERE 'Chichester' NOT IN (SELECT NAME FROM hundred); INSERT INTO hundred (name, name_slug, status) SELECT 'Chichester', 'chichester', NULL WHERE 'Chichester' NOT IN (SELECT NAME FROM hundred); SELECT * FROM hundred . Есть одна запись.

khms · Answer 5 · 2013-09-06T10-54-00.000Z

Если вы просто хотите вставить или не вставить (и не обновлять в противном случае), вы можете сделать это так (используя пример счета):

INSERT INTO invoices (invoiceid, billed) SELECT '12345', 'TRUE'
WHERE NOT EXISTS (SELECT 1 FROM invoices WHERE invoiceid = '12345')

crististm · Answer 6 · 2012-03-30T10-40-00.000Z

9

Вы можете использовать VALUES - доступно в Postgres:

INSERT INTO person (name)
    SELECT name FROM person
    UNION 
    VALUES ('Bob')
    EXCEPT
    SELECT name FROM person;

crististm 30 март 2012, в 10:40

11

ВЫБЕРИТЕ имя ИЗ ЛИЧНОСТИ <--- что, если в человеке миллиард строк?
Henley Chiu 24 апр. 2013, в 00:34
1

Я думаю, что это хороший быстрый способ решить проблему, но только тогда, когда вы уверены, что исходная таблица никогда не станет огромной. У меня есть таблица, в которой никогда не будет больше 1000 строк, поэтому я могу использовать это решение.
Leonard 09 фев. 2015, в 08:34
0

ВАУ, это именно то, что мне было нужно. Я волновался, что мне нужно создать функцию или временную таблицу, но это исключает все это - спасибо!
Amalgovinus 03 фев. 2016, в 22:24

Показать ещё 1 комментарий

ktr · Answer 7 · 2012-05-21T17-02-00.000Z

Я знаю, что этот вопрос был давным-давно, но думал, что это может кому-то помочь. Я думаю, что самый простой способ сделать это - с помощью триггера. Например:.

Create Function ignore_dups() Returns Trigger
As $$
Begin
    If Exists (
        Select
            *
        From
            hundred h
        Where
            -- Assuming all three fields are primary key
            h.name = NEW.name
            And h.hundred_slug = NEW.hundred_slug
            And h.status = NEW.status
    ) Then
        Return NULL;
    End If;
    Return NEW;
End;
$$ Language plpgsql;

Create Trigger ignore_dups
    Before Insert On hundred
    For Each Row
    Execute Procedure ignore_dups();

Выполните этот код из приглашения psql (или, тем не менее, вы хотите выполнять запросы непосредственно в базе данных). Затем вы можете вставить как обычно из Python. Например:.

sql = "Insert Into hundreds (name, name_slug, status) Values (%s, %s, %s)"
cursor.execute(sql, (hundred, hundred_slug, status))

Обратите внимание, что как уже упоминалось @Thomas_Wouters, в приведенном выше коде используются параметры, а не конкатенация строки.

Если кому-то еще было интересно, из документов : «Сработали триггеры на уровне строк ДО того, как они могут вернуть ноль, чтобы сигнализировать диспетчеру триггеров пропустить оставшуюся операцию для этой строки (т. Е. Последующие триггеры не запускаются, а INSERT / UPDATE»). / DELETE не выполняется для этой строки.) Если возвращается ненулевое значение, то операция продолжается с этим значением строки. "
Именно этот ответ я искал. Чистый код, используя функцию + триггер вместо оператора выбора. +1

Pavel Francírek · Answer 8 · 2015-03-26T14-01-00.000Z

INSERT.. WHERE NOT EXISTS - хороший подход. И условия гонки можно избежать транзакционным "конвертом":

BEGIN;
LOCK TABLE hundred IN SHARE ROW EXCLUSIVE MODE;
INSERT ... ;
COMMIT;

user6578371 · Answer 9 · 2016-07-12T09-37-00.000Z

Легко с правилами:

CREATE RULE file_insert_defer AS ON INSERT TO file
WHERE (EXISTS ( SELECT * FROM file WHERE file.id = new.id)) DO INSTEAD NOTHING

Но он терпит неудачу при одновременной записи...

Ritesh Jha · Answer 10 · 2017-10-14T05-48-00.000Z

Есть хороший способ сделать условный INSERT в PostgreSQL с помощью запроса WITH: Как:

WITH a as(
select 
 id 
from 
 schema.table_name 
where 
 column_name = your_identical_column_value
)
INSERT into 
 schema.table_name
(col_name1, col_name2)
SELECT
    (col_name1, col_name2)
WHERE NOT EXISTS (
     SELECT
         id
     FROM
         a
        )
  RETURNING id

vchrizz · Answer 11 · 2013-11-23T11-55-00.000Z

Подход с большинством upvotes (от John Doe) как-то работает для меня, но в моем случае из ожидаемых 422 строк я получаю только 180. Я не мог найти ничего плохого и ошибок не было, поэтому я искал другой простой подход.

Использование IF NOT FOUND THEN после SELECT просто отлично работает для меня.

(описано в Документация PostgreSQL)

Пример из документации:

SELECT * INTO myrec FROM emp WHERE empname = myname;
IF NOT FOUND THEN
  RAISE EXCEPTION 'employee % not found', myname;
END IF;

johnbaum · Answer 12 · 2010-11-01T16-52-00.000Z

Класс курсора psycopgs имеет атрибут rowcount.

Этот атрибут только для чтения указывает количество строк, которое последний execute *() (для операторов DQL, таких как SELECT) или затронутых (для DML, такие как UPDATE или INSERT).

Итак, вы можете сначала попробовать UPDATE и INSERT, только если rowcount равен 0.

Но в зависимости от уровней активности в вашей базе данных вы можете столкнуться с состоянием гонки между UPDATE и INSERT, где другой процесс может создать эту запись в промежуточный период.

Предположительно, завершение этих запросов в транзакции уменьшит состояние гонки.
Спасибо, действительно простое и чистое решение

Patrick · Answer 13 · 2016-07-26T01-10-00.000Z

Вот общая функция python, которая задает имя, столбцы и значения tablename, генерирует эквивалент upsert для postgresql.

import json

def upsert(table_name, id_column, other_columns, values_hash):

    template = """
    WITH new_values ($$ALL_COLUMNS$$) as (
      values
         ($$VALUES_LIST$$)
    ),
    upsert as
    (
        update $$TABLE_NAME$$ m
            set
                $$SET_MAPPINGS$$
        FROM new_values nv
        WHERE m.$$ID_COLUMN$$ = nv.$$ID_COLUMN$$
        RETURNING m.*
    )
    INSERT INTO $$TABLE_NAME$$ ($$ALL_COLUMNS$$)
    SELECT $$ALL_COLUMNS$$
    FROM new_values
    WHERE NOT EXISTS (SELECT 1
                      FROM upsert up
                      WHERE up.$$ID_COLUMN$$ = new_values.$$ID_COLUMN$$)
    """

    all_columns = [id_column] + other_columns
    all_columns_csv = ",".join(all_columns)
    all_values_csv = ','.join([query_value(values_hash[column_name]) for column_name in all_columns])
    set_mappings = ",".join([ c+ " = nv." +c for c in other_columns])

    q = template
    q = q.replace("$$TABLE_NAME$$", table_name)
    q = q.replace("$$ID_COLUMN$$", id_column)
    q = q.replace("$$ALL_COLUMNS$$", all_columns_csv)
    q = q.replace("$$VALUES_LIST$$", all_values_csv)
    q = q.replace("$$SET_MAPPINGS$$", set_mappings)

    return q


def query_value(value):
    if value is None:
        return "NULL"
    if type(value) in [str, unicode]:
        return "'%s'" % value.replace("'", "''")
    if type(value) == dict:
        return "'%s'" % json.dumps(value).replace("'", "''")
    if type(value) == bool:
        return "%s" % value
    if type(value) == int:
        return "%s" % value
    return value


if __name__ == "__main__":

    my_table_name = 'mytable'
    my_id_column = 'id'
    my_other_columns = ['field1', 'field2']
    my_values_hash = {
        'id': 123,
        'field1': "john",
        'field2': "doe"
    }
    print upsert(my_table_name, my_id_column, my_other_columns, my_values_hash)

Jeff Fairley · Answer 14 · 2014-09-26T07-40-00.000Z

Я искал аналогичное решение, пытаясь найти SQL, который работает в PostgreSQL, а также в HSQLDB. (HSQLDB было тем, что сделало это трудным.) Используя ваш пример в качестве основы, это формат, который я нашел в другом месте.

sql = "INSERT INTO hundred (name,name_slug,status)"
sql += " ( SELECT " + hundred + ", '" + hundred_slug + "', " + status
sql += " FROM hundred"
sql += " WHERE name = " + hundred + " AND name_slug = '" + hundred_slug + "' AND status = " + status
sql += " HAVING COUNT(*) = 0 );"

el fuser · Answer 15 · 2016-11-08T11-27-00.000Z

Решение в простой, но не сразу.
Если вы хотите использовать эту инструкцию, вы должны внести одно изменение в db:

ALTER USER user SET search_path to 'name_of_schema';

после этих изменений "INSERT" будет работать правильно.