Skip to main content

Join

Подготовленная структура данных для использования в операциях JOIN.

Создание таблицы

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
) ENGINE = Join(join_strictness, join_type, k1[, k2, ...])

Смотрите подробное описание запроса CREATE TABLE.

Параметры движка

  • join_strictnessстрогость JOIN.
  • join_typeтип JOIN.
  • k1[, k2, ...] – ключевые столбцы секции USING с которыми выполняется операция JOIN.

Вводите параметры join_strictness и join_type без кавычек, например, Join(ANY, LEFT, col1). Они должны быть такими же как и в той операции JOIN, в которой таблица будет использоваться. Если параметры не совпадают, ClickHouse не генерирует исключение и может возвращать неверные данные.

Особенности и рекомендации

Хранение данных

Данные таблиц Join всегда находятся в оперативной памяти. При вставке строк в таблицу ClickHouse записывает блоки данных в каталог на диске, чтобы их можно было восстановить при перезапуске сервера.

При аварийном перезапуске сервера блок данных на диске может быть потерян или повреждён. В последнем случае может потребоваться вручную удалить файл с повреждёнными данными.

Выборка и добавление данных

Для добавления данных в таблицы с движком Join используйте запрос INSERT. Если таблица создавалась со строгостью ANY, то данные с повторяющимися ключами игнорируются. Если задавалась строгость ALL, то добавляются все строки.

Основные применения Join таблиц:

  • Использование в правой части секции JOIN.
  • Извлечение данных из таблицы таким же образом как из словаря с помощью функции joinGet.

Удаление данных

Запросы ALTER DELETE для таблиц с движком Join выполняются как мутации. При выполнении мутации DELETE считываются отфильтрованные данные и перезаписываются в оперативную память и на диск.

Ограничения и настройки

При создании таблицы применяются следующие настройки:

Таблицы с движком Join нельзя использовать в операциях GLOBAL JOIN.

Движок Join позволяет использовать настройку join_use_nulls в запросе CREATE TABLE. Необходимо использовать одно и то же значение параметра join_use_nulls в запросах CRATE TABLE и SELECT.

Примеры использования

Создание левой таблицы:

CREATE TABLE id_val(`id` UInt32, `val` UInt32) ENGINE = TinyLog;
INSERT INTO id_val VALUES (1,11)(2,12)(3,13);

Создание правой таблицы с движком Join:

CREATE TABLE id_val_join(`id` UInt32, `val` UInt8) ENGINE = Join(ANY, LEFT, id);
INSERT INTO id_val_join VALUES (1,21)(1,22)(3,23);

Объединение таблиц:

SELECT * FROM id_val ANY LEFT JOIN id_val_join USING (id);
┌─id─┬─val─┬─id_val_join.val─┐
│ 1 │ 11 │ 21 │
│ 2 │ 12 │ 0 │
│ 3 │ 13 │ 23 │
└────┴─────┴─────────────────┘

В качестве альтернативы, можно извлечь данные из таблицы Join, указав значение ключа объединения:

SELECT joinGet('id_val_join', 'val', toUInt32(1));
┌─joinGet('id_val_join', 'val', toUInt32(1))─┐
│ 21 │
└────────────────────────────────────────────┘

Удаление данных из таблицы Join:

ALTER TABLE id_val_join DELETE WHERE id = 3;
┌─id─┬─val─┐
│ 1 │ 21 │
└────┴─────┘