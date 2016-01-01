Источник словаря Executable Pool
Пул исполняемых процессов позволяет загружать данные из пула процессов. Этот источник не работает с макетами словаря, которым необходимо загружать все данные из источника.
Пул исполняемых процессов работает, если словарь хранится с использованием одного из следующих макетов:
cache
complex_key_cache
ssd_cache
complex_key_ssd_cache
direct
complex_key_direct
Пул исполняемых процессов создаёт пул процессов с указанной командой и поддерживает их работу до их завершения. Программа должна читать данные из STDIN, пока они доступны, и выводить результат в STDOUT. Она может ожидать следующий блок данных в STDIN. ClickHouse не будет закрывать STDIN после обработки блока данных, а при необходимости передаст по каналу очередной фрагмент данных. Исполняемый скрипт должен быть готов к такому способу обработки данных — он должен опрашивать STDIN и оперативно сбрасывать данные в STDOUT.
Пример настроек:
- DDL
- Configuration file
Поля настроек:
|Setting
|Description
command
|Абсолютный путь к исполняемому файлу или имя файла (если каталог программы добавлен в
PATH).
format
|Формат. Поддерживаются все форматы, описанные в Formats.
pool_size
|Размер пула. Если для
pool_size указано значение 0, то размер пула не ограничен. Значение по умолчанию —
16.
command_termination_timeout
|Исполняемый скрипт должен содержать основной цикл чтения-записи. После уничтожения словаря канал закрывается, и у исполняемого файла будет
command_termination_timeout секунд на завершение работы, прежде чем ClickHouse отправит процессу-потомку сигнал SIGTERM. Задаётся в секундах. Значение по умолчанию —
10. Необязательный параметр.
max_command_execution_time
|Максимальное время выполнения команды исполняемого скрипта для обработки блока данных. Задаётся в секундах. Значение по умолчанию —
10. Необязательный параметр.
command_read_timeout
|Таймаут чтения данных из stdout команды в миллисекундах. Значение по умолчанию —
10000. Необязательный параметр.
command_write_timeout
|Таймаут записи данных в stdin команды в миллисекундах. Значение по умолчанию —
10000. Необязательный параметр.
implicit_key
|Исполняемый файл источника может возвращать только значения, а соответствие запрошенным ключам определяется неявно по порядку строк в результате. Значение по умолчанию —
false. Необязательный параметр.
execute_direct
|Если
execute_direct =
1, то
command будет искаться внутри папки user_scripts, заданной параметром user_scripts_path. Дополнительные аргументы скрипта можно указать, используя в качестве разделителя пробел. Пример:
script_name arg1 arg2. Если
execute_direct =
0,
command передаётся как аргумент для
bin/sh -c. Значение по умолчанию —
1. Необязательный параметр.
send_chunk_header
|Управляет тем, нужно ли отправлять количество строк перед отправкой фрагмента данных в процесс. Значение по умолчанию —
false. Необязательный параметр.
Этот источник словаря может быть настроен только через XML-конфигурацию. Создание словарей с исполняемым источником через DDL отключено, иначе пользователь БД смог бы выполнять произвольные исполняемые файлы на узле ClickHouse.