Табличная функция mergeTreeTextIndex

Представляет словарь текстового индекса в таблицах MergeTree. Возвращает токены вместе с метаданными их списков вхождений. Может использоваться для интроспекции.

Синтаксис

mergeTreeTextIndex(database, table, index_name)

Аргументы

АргументОписание
databaseИмя базы данных, из которой считывается текстовый индекс.
tableИмя таблицы, из которой считывается текстовый индекс.
index_nameТекстовый индекс, из которого производится чтение.

Возвращаемое значение

Объект таблицы с токенами и метаданными их списков вхождений.

Пример использования

CREATE TABLE tab
(
    id UInt64,
    s String,
    INDEX idx_s (s) TYPE text(tokenizer = splitByNonAlpha)
)
ENGINE = MergeTree
ORDER BY id;

INSERT INTO tab SELECT number, concatWithSeparator(' ', 'apple', 'banana') FROM numbers(500);
INSERT INTO tab SELECT 500 + number, concatWithSeparator(' ', 'cherry', 'date') FROM numbers(500);

SELECT * FROM mergeTreeTextIndex(currentDatabase(), tab, idx_s);

Результат:

   ┌─part_name─┬─token──┬─dictionary_compression─┬─cardinality─┬─num_posting_blocks─┬─has_embedded_postings─┬─has_raw_postings─┬─has_compressed_postings─┐
1. │ all_1_1_0 │ apple  │ front_coded            │         500 │                  1 │                     0 │                0 │                       0 │
2. │ all_1_1_0 │ banana │ front_coded            │         500 │                  1 │                     0 │                0 │                       0 │
3. │ all_2_2_0 │ cherry │ front_coded            │         500 │                  1 │                     0 │                0 │                       0 │
4. │ all_2_2_0 │ date   │ front_coded            │         500 │                  1 │                     0 │                0 │                       0 │
   └───────────┴────────┴────────────────────────┴─────────────┴────────────────────┴───────────────────────┴──────────────────┴─────────────────────────┘