Перейти к основному содержимому
Перейти к основному содержимому

Начало работы с форматами таблиц lakehouse

В этом руководстве представлен практический обзор основных возможностей ClickHouse для работы с форматами таблиц lakehouse.

Запросы к данным на месте

ClickHouse может выступать в роли движка запросов по открытым форматам таблиц, хранящимся в Объектном хранилище. Не дублируя данные, пользователи могут указать ClickHouse существующие таблицы Iceberg, Delta Lake, Hudi или Paimon и сразу же начинать выполнять запросы — как для обеспечения продакшен-нагрузки, так и для интерактивного исследования данных. Это можно делать посредством прямого чтения с использованием табличных функций и движков таблиц или подключившись к дата-каталогу.

Ускорение аналитики

Для рабочих нагрузок, которым требуются ответы с низкой задержкой и высокая степень параллелизма, загрузка данных из открытых табличных форматов в движок MergeTree ClickHouse обеспечивает существенно более высокую производительность. Благодаря использованию разреженного первичного индекса, пропускающих индексов и столбцового хранения запросы, которые при работе с файлами Parquet выполняются секунды, завершаются за миллисекунды.

Обратная запись данных

Данные также могут передаваться из ClickHouse обратно в открытые табличные форматы. Независимо от того, выгружаете ли вы устаревшие данные в долгосрочное хранилище или публикуете результаты преобразований для дальнейшего использования, ClickHouse может записывать в таблицы Iceberg и Delta в объектном хранилище.