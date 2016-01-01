Структуры словарей

Существует несколько способов хранения словарей в памяти, каждый из которых имеет свои компромиссы между использованием CPU и RAM.

Layout Description flat Хранит данные в плоских массивах, индексируемых по ключу. Самый быстрый вариант размещения, но ключи должны быть типа UInt64 и ограничены max_array_size . hashed Хранит данные в хеш-таблице. Нет ограничения на размер ключа, поддерживает любое количество элементов. sparse_hashed Как hashed , но расходует больше CPU в обмен на меньшее потребление памяти. complex_key_hashed Как hashed , но для составных ключей. complex_key_sparse_hashed Как sparse_hashed , но для составных ключей. hashed_array Атрибуты хранятся в массивах с хеш-таблицей, сопоставляющей ключи с индексами массивов. Эффективно по памяти при большом количестве атрибутов. complex_key_hashed_array Как hashed_array , но для составных ключей. range_hashed Хеш-таблица с упорядоченными диапазонами. Поддерживает поиск по ключу и диапазону даты/времени. complex_key_range_hashed Как range_hashed , но для составных ключей. cache Кэш фиксированного размера в памяти. Хранятся только часто запрашиваемые ключи. complex_key_cache Как cache , но для составных ключей. ssd_cache Как cache , но хранит данные на SSD с индексом в памяти. complex_key_ssd_cache Как ssd_cache , но для составных ключей. direct Нет хранения в памяти — источник запрашивается напрямую для каждого обращения. complex_key_direct Как direct , но для составных ключей. ip_trie Префиксное дерево (trie) для быстрого поиска IP-префиксов (на основе CIDR).

Рекомендуемые варианты размещения flat, hashed и complex_key_hashed обеспечивают наилучшую производительность запросов. Варианты размещения с кэшированием не рекомендуются из-за потенциально низкой производительности и сложности настройки параметров — подробности см. в разделе cache.

Совет Если вы используете словари с ClickHouse Cloud, используйте DDL-запрос для их создания и создавайте словари от имени пользователя default . Также проверьте список поддерживаемых источников словарей в руководстве по совместимости с ClickHouse Cloud.

Вы можете настроить макет словаря с помощью секции LAYOUT (для DDL) или параметра layout в определениях в конфигурационном файле.

DDL

Configuration file CREATE DICTIONARY (...) ... LAYOUT(LAYOUT_TYPE(param value)) -- параметры макета ... <clickhouse> <dictionary> ... <layout> <layout_type> <!-- параметры макета --> </layout_type> </layout> ... </dictionary> </clickhouse>

См. также CREATE DICTIONARY для полного синтаксиса DDL.

Словари, в имени макета которых нет слова complex-key* , имеют ключ типа UInt64, а словари с complex-key* имеют составной ключ (сложный, с произвольными типами).

Пример числового ключа (столбец key_column имеет тип UInt64):

DDL

Configuration file CREATE DICTIONARY dict_name ( key_column UInt64, ... ) PRIMARY KEY key_column <structure> <id> <name>key_column</name> </id> ... </structure>

Пример составного ключа (ключ состоит из одного элемента типа String):

DDL

Configuration file CREATE DICTIONARY dict_name ( country_code String, ... ) PRIMARY KEY country_code <structure> <key> <attribute> <name>country_code</name> <type>String</type> </attribute> </key> ... </structure>

Существует несколько способов повысить производительность словарей:

Вызывать функцию работы со словарём после GROUP BY .

. Пометить атрибуты для извлечения как инъективные. Атрибут называется инъективным, если разным ключам соответствуют различные значения атрибута. Поэтому, когда в GROUP BY используется функция, которая по ключу извлекает значение атрибута, эта функция автоматически выносится из GROUP BY .

ClickHouse генерирует исключение при ошибках, связанных со словарями. Примеры таких ошибок:

Не удалось загрузить словарь, к которому выполняется обращение.

Ошибка при запросе к словарю типа cached .

Вы можете просмотреть список словарей и их статусы в таблице system.dictionaries.