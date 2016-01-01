Миграция в Managed Postgres с использованием pg_dump и pg_restore

В этом руководстве приводятся пошаговые инструкции по переносу вашей базы данных PostgreSQL в ClickHouse Managed Postgres с использованием утилит pg_dump и pg_restore .

Доступ к исходной базе данных PostgreSQL.

pg_dump и pg_restore , установленные на вашем локальном компьютере. Как правило, они входят в стандартную установку PostgreSQL. Если нет, вы можете скачать их с официального сайта PostgreSQL.

Чтобы пройти все шаги, будем использовать пример базы данных RDS Postgres в качестве исходной базы данных. Что-то вроде этого:

Вот с чем мы работаем:

Две таблицы — events и users . events содержит миллион строк, а users — тысячу строк.

и . содержит миллион строк, а — тысячу строк. У events есть индекс.

есть индекс. Представление поверх таблицы events .

. Пара последовательностей

Теперь давайте используем pg_dump , чтобы создать файл дампа вышеописанных объектов. Это простая команда:

pg_dump \ -d 'postgresql://<user>:<password>@<host>:<port>/<database>' \ --format directory \ -f rds-dump

Здесь:

Замените <user> , <password> , <host> , <port> и <database> на параметры подключения к вашей исходной базе данных. Большинство провайдеров Postgres предоставляют строку подключения, которую можно использовать напрямую.

, , , и на параметры подключения к вашей исходной базе данных. Большинство провайдеров Postgres предоставляют строку подключения, которую можно использовать напрямую. --format directory указывает, что нам нужен дамп в формате каталога, который подходит для pg_restore .

указывает, что нам нужен дамп в формате каталога, который подходит для . -f rds-dump задает выходной каталог для файлов дампа. Обратите внимание, что этот каталог будет создан автоматически и не должен существовать заранее.

задает выходной каталог для файлов дампа. Обратите внимание, что этот каталог будет создан автоматически и не должен существовать заранее. Вы также можете распараллелить процесс создания дампа, добавив флаг --jobs , за которым следует количество параллельных заданий, которые вы хотите запустить. Для получения дополнительной информации обратитесь к документации по pg_dump.

Совет Вы можете один раз выполнить этот процесс, чтобы оценить, сколько времени он займет и каков будет размер файла дампа.

Ниже показано, как выглядит выполнение этой команды:

Теперь, когда у нас есть файл с дампом, мы можем восстановить его в наш экземпляр ClickHouse Managed Postgres с помощью утилиты pg_restore .

Сначала убедитесь, что у вас настроен экземпляр Managed Postgres, желательно в том же регионе, что и источник. Вы можете воспользоваться кратким руководством здесь. Вот что мы развернём для этого руководства:

Теперь, вернувшись на наш локальный компьютер, мы можем использовать команду pg_restore , чтобы восстановить дамп в наш управляемый экземпляр Postgres:

pg_restore \ -d 'postgresql://<user>:<password>@<pg_clickhouse_host>:5432/<database>' \ --verbose \ rds-dump

Вы можете получить строку подключения для экземпляра Managed Postgres в консоли ClickHouse Cloud; это очень просто, как показано здесь.

Здесь также есть несколько флагов, на которые стоит обратить внимание:

--verbose обеспечивает детализированный вывод в ходе процесса восстановления.

обеспечивает детализированный вывод в ходе процесса восстановления. Вы также можете использовать флаг --jobs , чтобы распараллелить процесс восстановления. Для получения дополнительных сведений обратитесь к документации по pg_restore.

В нашем случае это выглядит так:

После завершения процесса восстановления вы можете подключиться к своему экземпляру Managed Postgres и убедиться, что все ваши данные и объекты были успешно перенесены. Для подключения и выполнения запросов вы можете использовать любой PostgreSQL-клиент. Вот как выглядит наш Managed Postgres после миграции:

Мы видим, что у нас сохранены все таблицы, индексы, представления и последовательности, а также совпадает количество записей.

Убедитесь, что версии PostgreSQL для исходной и целевой баз данных совместимы. Использование версии pg_dump, более старой, чем версия исходного сервера, может привести к отсутствию некоторых функций или проблемам при восстановлении. В идеале используйте ту же или более новую мажорную версию pg_dump, чем у исходной базы данных.

Создание дампа и восстановление больших баз данных может занять значительное время. Планируйте это заранее, чтобы минимизировать простой, и по возможности рассмотрите использование параллельных операций дампа и восстановления (--jobs), если они поддерживаются.

Обратите внимание, что pg_dump / pg_restore не реплицируют все объекты, связанные с базой данных, и рабочее состояние сервера. К ним относятся роли и членство в ролях, слоты репликации (replication slots), конфигурация на уровне сервера (например, postgresql.conf, pg_hba.conf), табличные пространства и статистика выполнения (runtime statistics).

Поздравляем! Вы успешно мигрировали свою базу данных PostgreSQL в ClickHouse Managed Postgres с помощью pg_dump и pg_restore. Теперь вы готовы изучать возможности Managed Postgres и его интеграцию с ClickHouse. Ниже приведено краткое руководство на 10 минут, которое поможет вам начать работу: