Перейти к основному содержимому
Перейти к основному содержимому

AWS Glue Catalog

Experimental feature. Learn more.

ClickHouse поддерживает интеграцию с несколькими каталогами (Unity, Glue, Polaris и т.д.). В этом руководстве мы проведем вас через шаги, чтобы выполнить запрос к вашим данным в S3 корзинах, используя ClickHouse и Glue Data Catalog.

примечание

Glue поддерживает множество различных форматов таблиц, но эта интеграция поддерживает только таблицы Iceberg.

Настройка Glue в AWS

Чтобы подключиться к каталогу Glue, вам необходимо определить регион вашего каталога и предоставить ключ доступа и секретный ключ.

примечание

В настоящее время каталог Glue поддерживает только ключи доступа и секретные ключи, но в будущем мы поддержим дополнительные методы аутентификации.

Создание соединения между каталогом Glue и ClickHouse

После настройки вашего Unity Catalog и аутентификации, установите соединение между ClickHouse и Unity Catalog.

Выполнение запроса к каталогу данных Glue с использованием ClickHouse

Теперь, когда соединение установлено, вы можете начать выполнять запросы к Glue:

Вы можете видеть выше, что некоторые таблицы не являются таблицами Iceberg, например, iceberg-benchmark.hitsparquet. Вы не сможете выполнить запросы к ним, так как в настоящее время поддерживаются только таблицы Iceberg.

Чтобы выполнить запрос к таблице:

примечание

Обратные кавычки обязательны, так как ClickHouse не поддерживает более одного пространства имен.

Чтобы просмотреть DDL таблицы, выполните следующий запрос:

Загрузка данных из вашего Data Lake в ClickHouse

Если вам необходимо загрузить данные из Databricks в ClickHouse, начните с создания локальной таблицы ClickHouse:

Затем загрузите данные из вашей таблицы Iceberg: