AWS Glue Catalog
ClickHouse поддерживает интеграцию с несколькими каталогами (Unity, Glue, Polaris и т.д.). В этом руководстве мы проведем вас через шаги, чтобы выполнить запрос к вашим данным в S3 корзинах, используя ClickHouse и Glue Data Catalog.
Glue поддерживает множество различных форматов таблиц, но эта интеграция поддерживает только таблицы Iceberg.
Настройка Glue в AWS
Чтобы подключиться к каталогу Glue, вам необходимо определить регион вашего каталога и предоставить ключ доступа и секретный ключ.
В настоящее время каталог Glue поддерживает только ключи доступа и секретные ключи, но в будущем мы поддержим дополнительные методы аутентификации.
Создание соединения между каталогом Glue и ClickHouse
После настройки вашего Unity Catalog и аутентификации, установите соединение между ClickHouse и Unity Catalog.
Выполнение запроса к каталогу данных Glue с использованием ClickHouse
Теперь, когда соединение установлено, вы можете начать выполнять запросы к Glue:
Вы можете видеть выше, что некоторые таблицы не являются таблицами Iceberg, например, iceberg-benchmark.hitsparquet
. Вы не сможете выполнить запросы к ним, так как в настоящее время поддерживаются только таблицы Iceberg.
Чтобы выполнить запрос к таблице:
Обратные кавычки обязательны, так как ClickHouse не поддерживает более одного пространства имен.
Чтобы просмотреть DDL таблицы, выполните следующий запрос:
Загрузка данных из вашего Data Lake в ClickHouse
Если вам необходимо загрузить данные из Databricks в ClickHouse, начните с создания локальной таблицы ClickHouse:
Затем загрузите данные из вашей таблицы Iceberg: