типы размещения словаря hashed

Словарь полностью хранится в памяти в виде хеш-таблицы. Словарь может содержать произвольное количество элементов с любыми идентификаторами. На практике количество ключей может достигать десятков миллионов.

Ключ словаря имеет тип UInt64.

Поддерживаются все типы источников. При обновлении данные (из файла или таблицы) считываются целиком.

Пример конфигурации:

DDL

Configuration file LAYOUT(HASHED()) <layout> <hashed /> </layout>

Пример конфигурации с настройками:

DDL

Configuration file LAYOUT(HASHED([SHARDS 1] [SHARD_LOAD_QUEUE_BACKLOG 10000] [MAX_LOAD_FACTOR 0.5])) <layout> <hashed> <!-- Если количество shards больше 1 (по умолчанию `1`), словарь будет загружать данные параллельно; это полезно, если у вас очень много элементов в одном словаре. --> <shards>10</shards> <!-- Размер бэклога для блоков в параллельной очереди. Поскольку узким местом при параллельной загрузке является rehash, и чтобы избежать задержек из-за того, что поток выполняет rehash, нужен некоторый бэклог. 10000 — хороший баланс между потреблением памяти и скоростью. Даже для 10e10 элементов это позволяет обработать всю нагрузку без голодания. --> <shard_load_queue_backlog>10000</shard_load_queue_backlog> <!-- Максимальный коэффициент загрузки хеш-таблицы; при более высоких значениях память используется эффективнее (меньше нерационально расходуемой памяти), но производительность чтения может ухудшиться. Допустимые значения: [0.5, 0.99] Значение по умолчанию: 0.5 --> <max_load_factor>0.5</max_load_factor> </hashed> </layout>

Аналогичен hashed , но использует меньше памяти ценой большего расхода CPU.

Пример конфигурации:

DDL

Файл конфигурации LAYOUT(SPARSE_HASHED([SHARDS 1] [SHARD_LOAD_QUEUE_BACKLOG 10000] [MAX_LOAD_FACTOR 0.5])) <layout> <sparse_hashed> <!-- <shards>1</shards> --> <!-- <shard_load_queue_backlog>10000</shard_load_queue_backlog> --> <!-- <max_load_factor>0.5</max_load_factor> --> </sparse_hashed> </layout>

Для этого типа словаря также можно использовать параметр shards ; для sparse_hashed это даже важнее, чем для hashed , поскольку sparse_hashed работает медленнее.

Этот тип хранилища используется для составных ключей. По своей работе аналогичен hashed .

Пример конфигурации:

DDL

Файл конфигурации LAYOUT(COMPLEX_KEY_HASHED([SHARDS 1] [SHARD_LOAD_QUEUE_BACKLOG 10000] [MAX_LOAD_FACTOR 0.5])) <layout> <complex_key_hashed> <!-- <shards>1</shards> --> <!-- <shard_load_queue_backlog>10000</shard_load_queue_backlog> --> <!-- <max_load_factor>0.5</max_load_factor> --> </complex_key_hashed> </layout>

Этот тип хранилища предназначен для использования с составными ключами. Аналогичен sparse_hashed.

Пример конфигурации: