Миграция в Managed Postgres с использованием pg_dump и pg_restore
В этом руководстве приводятся пошаговые инструкции по переносу вашей базы данных PostgreSQL в ClickHouse Managed Postgres с использованием утилит pg_dump и pg_restore.
Предварительные требования
- Доступ к исходной базе данных PostgreSQL.
pg_dumpиpg_restore, установленные на вашем локальном компьютере. Как правило, они входят в стандартную установку PostgreSQL. Если нет, вы можете скачать их с официального сайта PostgreSQL.
Настройка
Чтобы пройти все шаги, будем использовать пример базы данных RDS Postgres в качестве исходной базы данных. Что-то вроде этого:

Вот с чем мы работаем:
- Две таблицы —
eventsиusers.eventsсодержит миллион строк, аusers— тысячу строк. - У
eventsесть индекс. - Представление поверх таблицы
events. - Пара последовательностей
Создайте дамп исходной базы данных
Теперь давайте используем pg_dump, чтобы создать файл дампа вышеописанных объектов. Это простая команда:
Здесь:
- Замените
<user>,<password>,<host>,<port>и<database>на параметры подключения к вашей исходной базе данных. Большинство провайдеров Postgres предоставляют строку подключения, которую можно использовать напрямую. --format directoryуказывает, что нам нужен дамп в формате каталога, который подходит дляpg_restore.-f rds-dumpзадает выходной каталог для файлов дампа. Обратите внимание, что этот каталог будет создан автоматически и не должен существовать заранее.- Вы также можете распараллелить процесс создания дампа, добавив флаг
--jobs, за которым следует количество параллельных заданий, которые вы хотите запустить. Для получения дополнительной информации обратитесь к документации по pg_dump.
Вы можете один раз выполнить этот процесс, чтобы оценить, сколько времени он займет и каков будет размер файла дампа.
Ниже показано, как выглядит выполнение этой команды:

Перенесите дамп в ClickHouse Managed Postgres
Теперь, когда у нас есть файл с дампом, мы можем восстановить его в наш экземпляр ClickHouse Managed Postgres с помощью утилиты pg_restore.
Создайте экземпляр Managed Postgres
Сначала убедитесь, что у вас настроен экземпляр Managed Postgres, желательно в том же регионе, что и источник. Вы можете воспользоваться кратким руководством здесь. Вот что мы развернём для этого руководства:

Восстановление дампа
Теперь, вернувшись на наш локальный компьютер, мы можем использовать команду pg_restore, чтобы восстановить дамп в наш управляемый экземпляр Postgres:
Вы можете получить строку подключения для экземпляра Managed Postgres в консоли ClickHouse Cloud; это очень просто, как показано здесь.
Здесь также есть несколько флагов, на которые стоит обратить внимание:
--verboseобеспечивает детализированный вывод в ходе процесса восстановления.- Вы также можете использовать флаг
--jobs, чтобы распараллелить процесс восстановления. Для получения дополнительных сведений обратитесь к документации по pg_restore.
В нашем случае это выглядит так:

Проверка миграции
После завершения процесса восстановления вы можете подключиться к своему экземпляру Managed Postgres и убедиться, что все ваши данные и объекты были успешно перенесены. Для подключения и выполнения запросов вы можете использовать любой PostgreSQL-клиент. Вот как выглядит наш Managed Postgres после миграции:

Мы видим, что у нас сохранены все таблицы, индексы, представления и последовательности, а также совпадает количество записей.
Соображения
- Убедитесь, что версии PostgreSQL для исходной и целевой баз данных совместимы. Использование версии pg_dump, более старой, чем версия исходного сервера, может привести к отсутствию некоторых функций или проблемам при восстановлении. В идеале используйте ту же или более новую мажорную версию pg_dump, чем у исходной базы данных.
- Создание дампа и восстановление больших баз данных может занять значительное время. Планируйте это заранее, чтобы минимизировать простой, и по возможности рассмотрите использование параллельных операций дампа и восстановления (--jobs), если они поддерживаются.
- Обратите внимание, что pg_dump / pg_restore не реплицируют все объекты, связанные с базой данных, и рабочее состояние сервера. К ним относятся роли и членство в ролях, слоты репликации (replication slots), конфигурация на уровне сервера (например, postgresql.conf, pg_hba.conf), табличные пространства и статистика выполнения (runtime statistics).
Дальнейшие шаги
Поздравляем! Вы успешно мигрировали свою базу данных PostgreSQL в ClickHouse Managed Postgres с помощью pg_dump и pg_restore. Теперь вы готовы изучать возможности Managed Postgres и его интеграцию с ClickHouse. Ниже приведено краткое руководство на 10 минут, которое поможет вам начать работу: