Postgres и индексы для внешних ключей и первичных ключей

198

В Postgres автоматически помещаются индексы на внешние ключи и первичные ключи? Как я могу сказать? Есть ли команда, которая вернет все индексы в таблице?

Теги:
database

6 ответов

254
Лучший ответ

PostgreSQL автоматически создает индексы для первичных ключей и уникальных ограничений, но не на ссылочной стороне отношений внешних ключей.

Когда Pg создает неявный индекс, он выдает сообщение NOTICE -level, которое вы можете увидеть в psql и/или в системных журналах, чтобы вы могли видеть, когда это произойдет. Автоматически созданные индексы отображаются также в выводе \d для таблицы.

Документация о уникальных индексах говорит:

PostgreSQL автоматически создает индекс для каждого уникального ограничения и ограничения первичного ключа для обеспечения уникальности. Таким образом, нет необходимости явно создавать индекс для столбцов первичного ключа.

и документация на constraints говорит:

Так как DELETE строки из ссылочной таблицы или UPDATE столбец, требующий проверки таблицы ссылок для строки, соответствующие старому значению, часто рекомендуется индексировать ссылки на столбцы. Потому что это не всегда необходимо, и есть доступно множество вариантов индексирования, объявления внешнего ключа ограничение не создает автоматически индекс для ссылки столбцы.

Поэтому вам нужно создавать индексы по внешним ключам самостоятельно, если вы хотите их.

Обратите внимание, что если вы используете первичные-внешние ключи, например 2 FK в качестве PK в таблице M-to-N, у вас будет индекс на PK и, вероятно, не нужно создавать какие-либо дополнительные индексы.

Хотя обычно рекомендуется создавать индекс на (или включая) столбцы внешнего ключа ссылочной стороны, он не требуется. Каждый добавленный вами индекс замедляет работу DML, поэтому вы платите стоимость исполнения на всех INSERT, UPDATE или DELETE. Если индекс используется редко, его не стоит иметь.

  • 22
    Я надеюсь, что это редактирование в порядке; Я добавил ссылки на соответствующую документацию, цитату, которая делает совершенно явным то, что ссылающаяся сторона отношений FK не производит неявный индекс, показал, как видеть индексы в psql, перефразировал 1-й параметр для ясности и добавил: обратите внимание, что индексы не являются бесплатными, поэтому не всегда правильно добавлять их.
  • 1
    @CraigRinger, как вы определяете, превосходит ли преимущество индекса его стоимость? Нужно ли профилировать модульные тесты до / после добавления индекса и проверять общее повышение производительности? Или есть лучший способ?
Показать ещё 2 комментария
27

Если вы хотите перечислить индексы всех таблиц в вашей схеме (ах) из вашей программы, вся информация находится в каталоге в каталоге:

select
     n.nspname  as "Schema"
    ,t.relname  as "Table"
    ,c.relname  as "Index"
from
          pg_catalog.pg_class c
     join pg_catalog.pg_namespace n on n.oid        = c.relnamespace
     join pg_catalog.pg_index i     on i.indexrelid = c.oid
     join pg_catalog.pg_class t     on i.indrelid   = t.oid
where
        c.relkind = 'i'
    and n.nspname not in ('pg_catalog', 'pg_toast')
    and pg_catalog.pg_table_is_visible(c.oid)
order by
     n.nspname
    ,t.relname
    ,c.relname

Если вы хотите углубиться (например, столбцы и порядок), вам нужно посмотреть pg_catalog.pg_index. Использование psql -E [dbname] пригодится для выяснения того, как запросить каталог.

  • 4
    +1, потому что использование pg_catalog и psql -E действительно очень полезно
18

Да - для первичных ключей, нет - для внешних ключей (больше в docs).

\d <table_name>

в "psql" показывает описание таблицы, включая все ее индексы.

  • 10
    Для справки \ di также перечислит все индексы в базе данных.
10

Этот запрос будет отображать отсутствующие индексы внешних ключей, исходный источник.

-- check for FKs where there is no matching index
-- on the referencing side
-- or a bad index

WITH fk_actions ( code, action ) AS (
    VALUES ( 'a', 'error' ),
        ( 'r', 'restrict' ),
        ( 'c', 'cascade' ),
        ( 'n', 'set null' ),
        ( 'd', 'set default' )
),
fk_list AS (
    SELECT pg_constraint.oid as fkoid, conrelid, confrelid as parentid,
        conname, relname, nspname,
        fk_actions_update.action as update_action,
        fk_actions_delete.action as delete_action,
        conkey as key_cols
    FROM pg_constraint
        JOIN pg_class ON conrelid = pg_class.oid
        JOIN pg_namespace ON pg_class.relnamespace = pg_namespace.oid
        JOIN fk_actions AS fk_actions_update ON confupdtype = fk_actions_update.code
        JOIN fk_actions AS fk_actions_delete ON confdeltype = fk_actions_delete.code
    WHERE contype = 'f'
),
fk_attributes AS (
    SELECT fkoid, conrelid, attname, attnum
    FROM fk_list
        JOIN pg_attribute
            ON conrelid = attrelid
            AND attnum = ANY( key_cols )
    ORDER BY fkoid, attnum
),
fk_cols_list AS (
    SELECT fkoid, array_agg(attname) as cols_list
    FROM fk_attributes
    GROUP BY fkoid
),
index_list AS (
    SELECT indexrelid as indexid,
        pg_class.relname as indexname,
        indrelid,
        indkey,
        indpred is not null as has_predicate,
        pg_get_indexdef(indexrelid) as indexdef
    FROM pg_index
        JOIN pg_class ON indexrelid = pg_class.oid
    WHERE indisvalid
),
fk_index_match AS (
    SELECT fk_list.*,
        indexid,
        indexname,
        indkey::int[] as indexatts,
        has_predicate,
        indexdef,
        array_length(key_cols, 1) as fk_colcount,
        array_length(indkey,1) as index_colcount,
        round(pg_relation_size(conrelid)/(1024^2)::numeric) as table_mb,
        cols_list
    FROM fk_list
        JOIN fk_cols_list USING (fkoid)
        LEFT OUTER JOIN index_list
            ON conrelid = indrelid
            AND (indkey::int2[])[0:(array_length(key_cols,1) -1)] @> key_cols

),
fk_perfect_match AS (
    SELECT fkoid
    FROM fk_index_match
    WHERE (index_colcount - 1) <= fk_colcount
        AND NOT has_predicate
        AND indexdef LIKE '%USING btree%'
),
fk_index_check AS (
    SELECT 'no index' as issue, *, 1 as issue_sort
    FROM fk_index_match
    WHERE indexid IS NULL
    UNION ALL
    SELECT 'questionable index' as issue, *, 2
    FROM fk_index_match
    WHERE indexid IS NOT NULL
        AND fkoid NOT IN (
            SELECT fkoid
            FROM fk_perfect_match)
),
parent_table_stats AS (
    SELECT fkoid, tabstats.relname as parent_name,
        (n_tup_ins + n_tup_upd + n_tup_del + n_tup_hot_upd) as parent_writes,
        round(pg_relation_size(parentid)/(1024^2)::numeric) as parent_mb
    FROM pg_stat_user_tables AS tabstats
        JOIN fk_list
            ON relid = parentid
),
fk_table_stats AS (
    SELECT fkoid,
        (n_tup_ins + n_tup_upd + n_tup_del + n_tup_hot_upd) as writes,
        seq_scan as table_scans
    FROM pg_stat_user_tables AS tabstats
        JOIN fk_list
            ON relid = conrelid
)
SELECT nspname as schema_name,
    relname as table_name,
    conname as fk_name,
    issue,
    table_mb,
    writes,
    table_scans,
    parent_name,
    parent_mb,
    parent_writes,
    cols_list,
    indexdef
FROM fk_index_check
    JOIN parent_table_stats USING (fkoid)
    JOIN fk_table_stats USING (fkoid)
WHERE table_mb > 9
    AND ( writes > 1000
        OR parent_writes > 1000
        OR parent_mb > 10 )
ORDER BY issue_sort, table_mb DESC, table_name, fk_name;
  • 4
    Не похоже на работу. Возвращает 0 строк, когда я знаю, что у меня есть столбцы без индексов, которые ссылаются на таблицы доменов.
  • 4
    @juanitogan Следите за пунктами where : Среди прочего, учитываются только таблицы, размер которых превышает 9 МБ.
Показать ещё 2 комментария
7

Для a PRIMARY KEY будет создан индекс со следующим сообщением:

NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index "index" for table "table" 

При a FOREIGN KEY ограничение не будет создано, если в таблице ссылок ed нет индекса.

Индекс таблицы референса ing не требуется (хотя и желательно) и поэтому не будет неявно создан.

5

Мне нравится, как это объясняется в статье Прохладные характеристики производительности EclipseLink 2.5

Индексирование внешних ключей

Первой особенностью является автоматическая индексация внешних ключей. Большинство людей ошибочно полагают, что индекс баз данных внешние ключи по умолчанию. Ну, они этого не делают. Первичные ключи автоматически индексированных, но внешних ключей нет. Это означает, что любой запрос, основанный на внешний ключ будет выполнять полное сканирование таблицы. Это любой OneToMany, ManyToMany или ElementCollection, а также много OneToOneотношения и большинство запросов на любые отношения, связанные с объединениями или сравнение объектов. Это может быть серьезной проблемой, и вы должны всегда индексируйте свои поля внешних ключей.

  • 2
    Если мы всегда должны индексировать поля внешних ключей, почему движки баз данных уже не делают этого? Мне кажется, это нечто большее, чем кажется на первый взгляд.
  • 1
    @Bobort Так как добавление индекса влечет за собой снижение производительности для всех вставок, обновлений и удалений, и в этом случае действительно может сложиться множество внешних ключей. Вот почему я думаю, что такое поведение является обязательным - разработчик должен сделать осознанный выбор в этом вопросе. Также могут быть случаи, когда внешний ключ используется для обеспечения целостности данных, но не запрашивается часто или вообще запрашивается - в этом случае снижение производительности индекса будет напрасным
Показать ещё 2 комментария

Ещё вопросы

Сообщество Overcoder
Наверх
Меню