Настройки форматов
Эти настройки автоматически сгенерированы из source.
bool_false_representation
Type: String
Default value: false
Текст для представления значения логического типа false в форматах TSV/CSV/Vertical/Pretty.
bool_true_representation
Type: String
Default value: true
Текст для представления значения логического типа true в форматах TSV/CSV/Vertical/Pretty.
column_names_for_schema_inference
Type: String
Default value:
Список имён колонок для использования в выводе схемы для форматов без имён колонок. Формат: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
Type: UInt64
Default value: 1
Использовать внутреннее соединение вместо запятой/перекрестного соединения, если в секции WHERE есть выражения для соединения. Значения: 0 - без переписывания, 1 - применять, если возможно для запятой/перекрестного, 2 - принудительное переписывание всех запятой, перекрестное - если возможно
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
Type: Bool
Default value: 0
Динамически обрезать конечные нули значений datetime64, чтобы отрегулировать масштаб вывода к [0, 3, 6], соответствующему 'секундам', 'миллисекундам' и 'микросекундам'
date_time_input_format
Type: DateTimeInputFormat
Default value: basic
Позволяет выбрать парсер текстового представления даты и времени.
Этот параметр не применяется к функциям даты и времени.
Возможные значения:
-
'best_effort'
— Включает расширенное парсинг.ClickHouse может парсить базовый формат
YYYY-MM-DD HH:MM:SS
и все форматы даты и времени ISO 8601. Например,'2018-06-08T01:02:03.000Z'
. -
'basic'
— Использовать базовый парсер.ClickHouse может парсить только базовый формат
YYYY-MM-DD HH:MM:SS
илиYYYY-MM-DD
. Например,2019-08-20 10:18:56
или2019-08-20
.
Cloud default value: 'best_effort'
.
Смотрите также:
date_time_output_format
Type: DateTimeOutputFormat
Default value: simple
Позволяет выбирать различные выходные форматы текстового представления даты и времени.
Возможные значения:
-
simple
- Простой выходной формат.ClickHouse выводит дату и время в формате
YYYY-MM-DD hh:mm:ss
. Например,2019-08-20 10:18:56
. Расчеты выполняются в соответствии с временной зоной типа данных (если присутствует) или временной зоной сервера. -
iso
- ISO выходной формат.ClickHouse выводит дату и время в формате ISO 8601
YYYY-MM-DDThh:mm:ssZ
. Например,2019-08-20T10:18:56Z
. Обратите внимание, что вывод в UTC (Z
означает UTC). -
unix_timestamp
- Выходной формат Unix timestamp.ClickHouse выводит дату и время в формате Unix timestamp. Например
1566285536
.
Смотрите также:
date_time_overflow_behavior
Type: DateTimeOverflowBehavior
Default value: ignore
Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в целевом типе.
Возможные значения:
ignore
— Тихо игнорировать переполнения. Результаты неопределены.throw
— Вызывать исключение в случае переполнения.saturate
— Насыщать результат. Если значение меньше наименьшего значения, которое может быть представлено целевым типом, выбирается наименьшее представимое значение. Если значение больше наибольшего значения, которое может быть представлено целевым типом, выбирается наибольшее представимое значение.
Default value: ignore
.
dictionary_use_async_executor
Type: Bool
Default value: 0
Выполнять конвейер для чтения источника словаря в нескольких потоках. Это поддерживается только для словарей с локальным источником CLICKHOUSE.
errors_output_format
Type: String
Default value: CSV
Метод для записи ошибок в текстовый вывод.
exact_rows_before_limit
Type: Bool
Default value: 0
При включении ClickHouse предоставит точное значение для статистики rows_before_limit_at_least, но с тем ценой, что данные перед лимитом нужно будет прочитать полностью
format_avro_schema_registry_url
Type: URI
Default value:
Для формата AvroConfluent: URL реестра схем Confluent.
format_binary_max_array_size
Type: UInt64
Default value: 1073741824
Максимально допустимый размер для массива в формате RowBinary. Он предотвращает выделение большого количества памяти в случае поврежденных данных. 0 означает, что ограничений нет
format_binary_max_string_size
Type: UInt64
Default value: 1073741824
Максимально допустимый размер для строки в формате RowBinary. Он предотвращает выделение большого количества памяти в случае поврежденных данных. 0 означает, что ограничений нет
format_capn_proto_enum_comparising_mode
Type: CapnProtoEnumComparingMode
Default value: by_values
Как сопоставить ClickHouse Enum и CapnProto Enum
format_capn_proto_use_autogenerated_schema
Type: Bool
Default value: 1
Использовать автоматически сгенерированную схему CapnProto, когда format_schema не задан
format_csv_allow_double_quotes
Type: Bool
Default value: 1
Если установлено в true, разрешить строки в двойных кавычках.
format_csv_allow_single_quotes
Type: Bool
Default value: 0
Если установлено в true, разрешить строки в одинарных кавычках.
format_csv_delimiter
Type: Char
Default value: ,
Символ, который будет считаться разделителем в данных CSV. Если установка представляет собой строку, длина строки должна быть 1.
format_csv_null_representation
Type: String
Default value: \N
Пользовательское представление NULL в формате CSV
format_custom_escaping_rule
Type: EscapingRule
Default value: Escaped
Правило экранирования полей (для формата CustomSeparated)
format_custom_field_delimiter
Type: String
Default value:
Разделитель между полями (для формата CustomSeparated)
format_custom_result_after_delimiter
Type: String
Default value:
Суффикс после набора результатов (для формата CustomSeparated)
format_custom_result_before_delimiter
Type: String
Default value:
Префикс перед набором результатов (для формата CustomSeparated)
format_custom_row_after_delimiter
Type: String
Default value:
Разделитель после поля последней колонки (для формата CustomSeparated)
format_custom_row_before_delimiter
Type: String
Default value:
Разделитель перед полем первой колонки (для формата CustomSeparated)
format_custom_row_between_delimiter
Type: String
Default value:
Разделитель между строками (для формата CustomSeparated)
format_display_secrets_in_show_and_select
Type: Bool
Default value: 0
Включает или отключает отображение секретов в запросах SHOW
и SELECT
для таблиц, баз данных,
таблиц функций и словарей.
Пользователь, желающий видеть секреты, также должен иметь
display_secrets_in_show_and_select
server setting
включённым и иметь привилегию
displaySecretsInShowAndSelect
.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
format_json_object_each_row_column_for_object_name
Type: String
Default value:
Имя колонки, которое будет использоваться для хранения/записи имён объектов в JSONObjectEachRow формате.
Тип колонки должен быть String. Если значение пустое, будут использоваться имена по умолчанию row_{i}
.
input_format_json_compact_allow_variable_number_of_columns
Разрешить переменное количество колонок в строках в JSONCompact/JSONCompactEachRow входных форматах. Игнорировать дополнительные колонки в строках с большим количеством колонок, чем ожидается, и рассматривать отсутствующие колонки как значения по умолчанию.
Отключено по умолчанию.
output_format_markdown_escape_special_characters
При включении экранировать специальные символы в Markdown.
Common Mark определяет следующие специальные символы, которые могут быть экранированы с помощью :
Возможные значения:
- 0 — Отключение.
- 1 — Включение.
input_format_json_empty_as_default
При включении заменять пустые входные поля в JSON на значения по умолчанию. Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields
также должно быть включено.
Возможные значения:
- 0 — Отключить.
- 1 — Включить.
format_protobuf_use_autogenerated_schema
Type: Bool
Default value: 1
Использовать автоматически сгенерированный Protobuf, когда format_schema не установлен
format_regexp
Type: String
Default value:
Регулярное выражение (для формата Regexp)
format_regexp_escaping_rule
Type: EscapingRule
Default value: Raw
Правило экранирования полей (для формата Regexp)
format_regexp_skip_unmatched
Type: Bool
Default value: 0
Пропускать строки, не соответствующие регулярному выражению (для формата Regexp)
format_schema
Type: String
Default value:
Этот параметр полезен, когда вы используете форматы, требующие определения схемы, такие как Cap'n Proto или Protobuf. Значение зависит от формата.
format_template_resultset
Type: String
Default value:
Путь к файлу, содержащему строку формата для набора результатов (для формата Template)
format_template_resultset_format
Type: String
Default value:
Строка формата для набора результатов (для формата Template)
format_template_row
Type: String
Default value:
Путь к файлу, содержащему строку формата для строк (для формата Template)
format_template_row_format
Type: String
Default value:
Строка формата для строк (для формата Template)
format_template_rows_between_delimiter
Type: String
Default value:
Разделитель между строками (для формата Template)
format_tsv_null_representation
Type: String
Default value: \N
Пользовательское представление NULL в формате TSV
input_format_allow_errors_num
Type: UInt64
Default value: 0
Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т. д.).
Значение по умолчанию — 0.
Всегда используйте в сочетании с input_format_allow_errors_ratio
.
Если возникла ошибка при чтении строк, но счётчик ошибок всё ещё меньше, чем input_format_allow_errors_num
, ClickHouse игнорирует строку и переходит к следующей.
Если одновременно превышены input_format_allow_errors_num
и input_format_allow_errors_ratio
, ClickHouse выбрасывает исключение.
input_format_allow_errors_ratio
Type: Float
Default value: 0
Устанавливает максимальный процент ошибок, допустимых при чтении из текстовых форматов (CSV, TSV и т. д.). Процент ошибок задаётся в виде числа с плавающей запятой между 0 и 1.
Значение по умолчанию — 0.
Всегда используйте в сочетании с input_format_allow_errors_num
.
Если возникла ошибка при чтении строк, но счётчик ошибок всё ещё меньше, чем input_format_allow_errors_ratio
, ClickHouse игнорирует строку и переходит к следующей.
Если одновременно превышены input_format_allow_errors_num
и input_format_allow_errors_ratio
, ClickHouse выбрасывает исключение.
input_format_allow_seeks
Type: Bool
Default value: 1
Разрешить позиционирование при чтении в ORC/Parquet/Arrow входных форматах.
Включено по умолчанию.
input_format_arrow_allow_missing_columns
Type: Bool
Default value: 1
Разрешить отсутствие колонок при чтении Arrow входных форматов
input_format_arrow_case_insensitive_column_matching
Type: Bool
Default value: 0
Игнорировать регистр при сопоставлении колонок Arrow с колонками CH.
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Type: Bool
Default value: 0
Пропускать колонки с неподдерживаемыми типами при выводе схемы для формата Arrow
input_format_avro_allow_missing_fields
Type: Bool
Default value: 0
Для формата Avro/AvroConfluent: когда поле не найдено в схеме, используйте значение по умолчанию вместо ошибки
input_format_avro_null_as_default
Type: Bool
Default value: 0
Для формата Avro/AvroConfluent: вставить значение по умолчанию в случае null и не Nullable колонок
input_format_binary_decode_types_in_binary_format
Type: Bool
Default value: 0
Читать типы данных в бинарном формате вместо имён типов в RowBinaryWithNamesAndTypes входном формате
input_format_binary_read_json_as_string
Type: Bool
Default value: 0
Читать значения типа JSON как значения типа JSON String в RowBinary входном формате.
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
Type: Bool
Default value: 0
Пропускать поля с неподдерживаемыми типами при выводе схемы для формата BSON.
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
Type: Bool
Default value: 0
Пропускать колонки с неподдерживаемыми типами при выводе схемы для формата CapnProto
input_format_csv_allow_cr_end_of_line
Type: Bool
Default value: 0
Если установлено в true, \r будет разрешён в конце строки, не следующей за \n
input_format_csv_allow_variable_number_of_columns
Type: Bool
Default value: 0
Игнорировать дополнительные колонки в CSV входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в CSV входных данных как значения по умолчанию
input_format_csv_allow_whitespace_or_tab_as_delimiter
Type: Bool
Default value: 0
Разрешить использовать пробелы и табуляции (\t) в качестве разделителей полей в CSV строках
input_format_csv_arrays_as_nested_csv
Type: Bool
Default value: 0
При чтении массива из CSV ожидать, что его элементы были сериализованы в вложенный CSV и затем помещены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Скобки вокруг массива могут быть опущены.
input_format_csv_deserialize_separate_columns_into_tuple
Type: Bool
Default value: 1
Если установлено в true, тогда отдельные колонки, записанные в формате CSV, могут быть десериализованы в колонку Tuple.
input_format_csv_detect_header
Type: Bool
Default value: 1
Автоматически обнаруживать заголовок с именами и типами в формате CSV
input_format_csv_empty_as_default
Type: Bool
Default value: 1
Рассматривать пустые поля в CSV входных данных как значения по умолчанию.
input_format_csv_enum_as_number
Type: Bool
Default value: 0
Рассматривать вставленные значения enum в CSV форматах как индексы enum
input_format_csv_skip_first_lines
Type: UInt64
Default value: 0
Пропускать указанное количество строк в начале данных в CSV формате
input_format_csv_skip_trailing_empty_lines
Type: Bool
Default value: 0
Пропускать конечные пустые строки в CSV формате
input_format_csv_trim_whitespaces
Type: Bool
Default value: 1
Удалять пробелы и символы табуляции (\t) в начале и конце строк в CSV строках
input_format_csv_try_infer_numbers_from_strings
Type: Bool
Default value: 0
Если включено, при выводе схемы ClickHouse попытается вывести числа из строковых полей. Это может быть полезно, если данные CSV содержат заключённые в кавычки числа UInt64.
Отключено по умолчанию.
input_format_csv_try_infer_strings_from_quoted_tuples
Type: Bool
Default value: 1
Интерпретировать заключённые в кавычки кортежи в входных данных как значение типа String.
input_format_csv_use_best_effort_in_schema_inference
Type: Bool
Default value: 1
Использовать некоторые настройки и эвристики для вывода схемы в CSV формате
input_format_csv_use_default_on_bad_values
Type: Bool
Default value: 0
Позволить установить значение по умолчанию для колонки, когда десериализация поля CSV завершилась неудачей из-за неверного значения
input_format_custom_allow_variable_number_of_columns
Type: Bool
Default value: 0
Игнорировать дополнительные колонки в формате CustomSeparated (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в формате CustomSeparated как значения по умолчанию
input_format_custom_detect_header
Type: Bool
Default value: 1
Автоматически обнаруживать заголовок с именами и типами в формате CustomSeparated
input_format_custom_skip_trailing_empty_lines
Type: Bool
Default value: 0
Пропускать конечные пустые строки в формате CustomSeparated
input_format_defaults_for_omitted_fields
Type: Bool
Default value: 1
При выполнении запросов INSERT
заменять пропущенные значения столбцов на значения по умолчанию соответствующих столбцов. Эта опция применяется к JSONEachRow (и другим JSON форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native форматам и форматам с суффиксами WithNames
/WithNamesAndTypes
.
Когда эта опция включена, расширенная метаданные таблицы отправляются от сервера к клиенту. Это потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_force_null_for_omitted_fields
Type: Bool
Default value: 0
Принудительно инициализировать пропущенные поля нулевыми значениями
input_format_hive_text_allow_variable_number_of_columns
Type: Bool
Default value: 1
Игнорировать дополнительные колонки в Hive Text входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в Hive Text входных данных как значения по умолчанию
input_format_hive_text_collection_items_delimiter
Type: Char
Default value:
Разделитель между элементами коллекции (массива или карты) в Hive Text файле
input_format_hive_text_fields_delimiter
Type: Char
Default value:
Разделитель между полями в Hive Text файле
input_format_hive_text_map_keys_delimiter
Type: Char
Default value:
Разделитель между парой ключ/значение карты в Hive Text файле
input_format_import_nested_json
Type: Bool
Default value: 0
Включает или отключает вставку данных JSON с вложенными объектами.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Смотрите также:
- Использование вложенных структур с форматом
JSONEachRow
.
input_format_ipv4_default_on_conversion_error
Type: Bool
Default value: 0
Десериализация IPv4 будет использовать значения по умолчанию вместо генерации исключения при ошибке преобразования.
Отключено по умолчанию.
input_format_ipv6_default_on_conversion_error
Type: Bool
Default value: 0
Десериализация IPV6 будет использовать значения по умолчанию вместо генерации исключения при ошибке преобразования.
Отключено по умолчанию.
input_format_json_compact_allow_variable_number_of_columns
Type: Bool
Default value: 0
Игнорировать дополнительные колонки в JSONCompact(EachRow) входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в JSONCompact(EachRow) входных данных как значения по умолчанию
input_format_json_defaults_for_missing_elements_in_named_tuple
Type: Bool
Default value: 1
Вставить значения по умолчанию для отсутствующих элементов в JSON объекте при разборе именованного кортежа.
Эта настройка работает только при включении настройки input_format_json_named_tuples_as_objects
.
Включено по умолчанию.
input_format_json_empty_as_default
Type: Bool
Default value: 0
Рассматривать пустые поля во входном JSON как значения по умолчанию.
input_format_json_ignore_unknown_keys_in_named_tuple
Type: Bool
Default value: 1
Игнорировать неизвестные ключи в JSON объекте для именованных кортежей.
Включено по умолчанию.
input_format_json_ignore_unnecessary_fields
Type: Bool
Default value: 1
Игнорировать ненужные поля и не разбирать их. Включение этого может не вызвать исключения на JSON строках неверного формата или с дублированными полями
input_format_json_infer_incomplete_types_as_strings
Type: Bool
Default value: 1
Разрешить использование типа String для JSON ключей, которые содержат только Null
/{}
/[]
в выборке данных при выводе схемы.
В форматах JSON любое значение может быть прочитано как String, и мы можем избежать ошибок, таких как Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps
при выводе схемы
используя тип String для ключей с неизвестными типами.
Пример:
Результат:
Включено по умолчанию.
input_format_json_max_depth
Type: UInt64
Default value: 1000
Максимальная глубина поля в JSON. Это не строгое ограничение, оно не обязательно должно применяться точно.
input_format_json_named_tuples_as_objects
Type: Bool
Default value: 1
Разбирать столбцы именованных кортежей как JSON объекты.
Включено по умолчанию.
input_format_json_read_arrays_as_strings
Type: Bool
Default value: 1
Разрешить разбор JSON массивов как строк в форматах входного JSON.
Пример:
Результат:
Включено по умолчанию.
input_format_json_read_bools_as_numbers
Type: Bool
Default value: 1
Разрешить разбор логических значений как чисел в форматах входного JSON.
Включено по умолчанию.
input_format_json_read_bools_as_strings
Type: Bool
Default value: 1
Разрешить разбор логических значений как строк в форматах входного JSON.
Включено по умолчанию.
input_format_json_read_numbers_as_strings
Type: Bool
Default value: 1
Разрешить разбор чисел как строк в форматах входного JSON.
Включено по умолчанию.
input_format_json_read_objects_as_strings
Type: Bool
Default value: 1
Разрешить разбор JSON объектов как строк в форматах входного JSON.
Пример:
Результат:
Включено по умолчанию.
input_format_json_throw_on_bad_escape_sequence
Type: Bool
Default value: 1
Вызывать исключение, если JSON строка содержит неправильную последовательность экранирования в форматах входного JSON. Если отключено, неправильные последовательности экранирования останутся как есть в данных.
Включено по умолчанию.
input_format_json_try_infer_named_tuples_from_objects
Type: Bool
Default value: 1
Если включено, при выводе схемы ClickHouse попытается вывести именованный кортеж из JSON объектов. Полученный именованный кортеж будет содержать все элементы из всех соответствующих JSON объектов из выборки данных.
Пример:
Результат:
Включено по умолчанию.
input_format_json_try_infer_numbers_from_strings
Type: Bool
Default value: 0
Если включено, при выводе схемы ClickHouse попытается вывести числа из строковых полей. Это может быть полезно, если данные JSON содержат заключённые в кавычки числа UInt64.
Отключено по умолчанию.
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects {#input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
Type: Bool
Default value: 0
Используйте тип String вместо исключения в случае неоднозначных путей в JSON объектах при выводе именованных кортежей.
Результат:
Пример запроса с отключенной настройкой
Запрос:
Результат:
output_format_json_escape_forward_slashes
Тип: Bool
Значение по умолчанию: 1
Контролирует экранирование косых черт для строковых выводов в формате JSON. Это предназначено для совместимости с JavaScript. Не путать с обратными слешами, которые всегда экранируются.
Включено по умолчанию.
output_format_json_named_tuples_as_objects
Тип: Bool
Значение по умолчанию: 1
Сериализовать колонки именованных кортежей как объекты JSON.
Включено по умолчанию.
output_format_json_pretty_print
Тип: Bool
Значение по умолчанию: 1
Когда включено, значения сложных типов данных, таких как Tuple/Array/Map, в формате JSON в разделе 'data' будут печататься в удобочитаемом формате.
Включено по умолчанию.
output_format_json_quote_64bit_floats
Тип: Bool
Значение по умолчанию: 0
Контролирует экранирование 64-битных чисел с плавающей запятой при их выводе в форматах JSON.
Отключено по умолчанию.
output_format_json_quote_64bit_integers
Тип: Bool
Значение по умолчанию: 1
Контролирует экранирование 64-битных или больших целых чисел (таких как UInt64
или Int128
) при их выводе в формате JSON.
Такие целые числа по умолчанию заключены в кавычки. Это поведение совместимо с большинством реализаций JavaScript.
Возможные значения:
- 0 — Целые числа выводятся без кавычек.
- 1 — Целые числа заключаются в кавычки.
output_format_json_quote_decimals
Тип: Bool
Значение по умолчанию: 0
Контролирует экранирование десятичных значений в форматах JSON.
Отключено по умолчанию.
output_format_json_quote_denormals
Тип: Bool
Значение по умолчанию: 0
Включает вывод +nan
, -nan
, +inf
, -inf
в формате JSON.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Пример
Рассмотрим следующую таблицу account_orders
:
Когда output_format_json_quote_denormals = 0
, запрос возвращает null
значения в выводе:
Когда output_format_json_quote_denormals = 1
, запрос возвращает:
output_format_json_skip_null_value_in_named_tuples
Тип: Bool
Значение по умолчанию: 0
Пропускать ключевые пары со значением null при сериализации колонок именованных кортежей как объектов JSON. Это действительно только в том случае, если output_format_json_named_tuples_as_objects истинно.
output_format_json_validate_utf8
Тип: Bool
Значение по умолчанию: 0
Контролирует валидацию последовательностей UTF-8 в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, они всегда валидируют UTF-8.
Отключено по умолчанию.
output_format_markdown_escape_special_characters
Тип: Bool
Значение по умолчанию: 0
Экранировать специальные символы в формате Markdown.
output_format_msgpack_uuid_representation
Тип: MsgPackUUIDRepresentation
Значение по умолчанию: ext
Способ вывода UUID в формате MsgPack.
output_format_native_encode_types_in_binary_format
Тип: Bool
Значение по умолчанию: 0
Записывать типы данных в бинарном формате вместо имён типов в родном формате вывода.
output_format_native_write_json_as_string
Тип: Bool
Значение по умолчанию: 0
Записывать данные колонки JSON как колонку String, содержащую JSON строки вместо стандартной сериализации JSON по умолчанию.
output_format_orc_compression_method
Тип: ORCCompression
Значение по умолчанию: zstd
Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (не сжатый).
output_format_orc_dictionary_key_size_threshold
Тип: Double
Значение по умолчанию: 0
Для строковой колонки в формате ORC, если количество различных значений превышает эту долю от общего количества ненулевых строк, отключить кодирование словарей. В противном случае включается кодирование словарей.
output_format_orc_row_index_stride
Тип: UInt64
Значение по умолчанию: 10000
Целевой шаг индекса строк в формате ORC.
output_format_orc_string_as_string
Тип: Bool
Значение по умолчанию: 1
Использовать тип ORC String вместо Binary для колонок String.
output_format_orc_writer_time_zone_name
Тип: String
Значение по умолчанию: GMT
Имя часового пояса для записи ORC, часовой пояс по умолчанию для записи ORC — GMT.
output_format_parquet_batch_size
Тип: UInt64
Значение по умолчанию: 1024
Проверить размер страницы каждые определённое количество строк. Рассмотрите возможность уменьшения, если у вас есть колонки со средним размером значений более нескольких КБ.
output_format_parquet_bloom_filter_bits_per_value
Тип: Double
Значение по умолчанию: 10.5
Приблизительное количество бит, которое нужно использовать для каждого уникального значения в bloom фильтрах parquet. Оценка вероятности ложных срабатываний:
- 6 бит - 10%
- 10.5 бит - 1%
- 16.9 бит - 0.1%
- 26.4 бит - 0.01%
- 41 бит - 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
Тип: UInt64
Значение по умолчанию: 134217728
Где в файле parquet разместить bloom фильтры. Bloom фильтры будут записываться группами примерно этого размера. В частности:
- если 0, bloom фильтры каждой группы строк записываются сразу после группы строк,
- если больше общего размера всех bloom фильтров, bloom фильтры для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
- в противном случае, bloom фильтры будут накапливаться в памяти и записываться, когда их общий размер превысит это значение.
output_format_parquet_compliant_nested_types
Тип: Bool
Значение по умолчанию: 1
В схеме файла parquet используйте имя 'element' вместо 'item' для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В общем, это увеличивает совместимость, кроме, возможно, с некоторыми старыми версиями Arrow.
output_format_parquet_compression_method
Тип: ParquetCompression
Значение по умолчанию: zstd
Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (не сжатый).
output_format_parquet_data_page_size
Тип: UInt64
Значение по умолчанию: 1048576
Целевой размер страницы в байтах, перед сжатием.
output_format_parquet_datetime_as_uint32
Тип: Bool
Значение по умолчанию: 0
Записывать значения DateTime как необработанные метки времени Unix (читать как UInt32), вместо преобразования в миллисекунды (читать как DateTime64(3)).
output_format_parquet_fixed_string_as_fixed_byte_array
Тип: Bool
Значение по умолчанию: 1
Использовать тип Parquet FIXED_LENGTH_BYTE_ARRAY вместо Binary для колонок FixedString.
output_format_parquet_parallel_encoding
Тип: Bool
Значение по умолчанию: 1
Выполнять кодирование Parquet в нескольких потоках. Требуется output_format_parquet_use_custom_encoder.
output_format_parquet_row_group_size
Тип: UInt64
Значение по умолчанию: 1000000
Целевой размер группы строк в строках.
output_format_parquet_row_group_size_bytes
Тип: UInt64
Значение по умолчанию: 536870912
Целевой размер группы строк в байтах, до сжатия.
output_format_parquet_string_as_string
Тип: Bool
Значение по умолчанию: 1
Использовать тип строк Parquet вместо Binary для колонок строк.
output_format_parquet_use_custom_encoder
Тип: Bool
Значение по умолчанию: 1
Использовать более быструю реализацию кодировщика Parquet.
output_format_parquet_version
Тип: ParquetVersion
Значение по умолчанию: 2.latest
Версия формата Parquet для формата вывода. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.latest (по умолчанию).
output_format_parquet_write_bloom_filter
Тип: Bool
Значение по умолчанию: 1
Записывать фильтры Блума в файлы parquet. Требуется output_format_parquet_use_custom_encoder = true.
output_format_parquet_write_page_index
Тип: Bool
Значение по умолчанию: 1
Записывать индекс колонок и индекс смещения (т.е. статистику о каждой странице данных, которая может использоваться для фильтров на чтение) в файлы parquet.
output_format_pretty_color
Тип: UInt64Auto
Значение по умолчанию: auto
Использовать последовательности управляемых ANSI в формате Pretty. 0 - отключено, 1 - включено, 'auto' - включено, если это терминал.
output_format_pretty_display_footer_column_names
Тип: UInt64
Значение по умолчанию: 1
Отображать названия колонок в нижнем колонтитуле, если есть много строк таблицы.
Возможные значения:
- 0 — Названия колонок не отображаются в нижнем колонтитуле.
- 1 — Названия колонок отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, установленному в output_format_pretty_display_footer_column_names_min_rows (по умолчанию 50).
Пример
Запрос:
Результат:
output_format_pretty_display_footer_column_names_min_rows
Тип: UInt64
Значение по умолчанию: 50
Устанавливает минимальное количество строк, для которых нижний колонтитул с названиями колонок будет отображаться, если установка output_format_pretty_display_footer_column_names включена.
output_format_pretty_fallback_to_vertical
Тип: Bool
Значение по умолчанию: 1
Если включено, и таблица широкая, но короткая, формат Pretty выведет её в том же формате, что и вертикальный формат.
Смотрите output_format_pretty_fallback_to_vertical_max_rows_per_chunk
и output_format_pretty_fallback_to_vertical_min_table_width
для подробной настройки этого поведения.
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Тип: UInt64
Значение по умолчанию: 10
Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical
) будет активирован только если количество записей в блоке не превышает указанное значение.
output_format_pretty_fallback_to_vertical_min_columns
Тип: UInt64
Значение по умолчанию: 5
Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical
) будет активирован только если количество колонок больше указанного значения.
output_format_pretty_fallback_to_vertical_min_table_width
Тип: UInt64
Значение по умолчанию: 250
Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical
) будет активирован только если сумма длин колонок в таблице составляет не менее указанного значения, или если хотя бы одно значение содержит перенос строки.
output_format_pretty_grid_charset
Тип: String
Значение по умолчанию: UTF-8
Кодировка для печати границ сетки. Доступные кодировки: ASCII, UTF-8 (по умолчанию).
output_format_pretty_highlight_digit_groups
Тип: Bool
Значение по умолчанию: 1
Если включено и если вывод идет в терминал, выделять каждую цифру, соответствующую количеству тысяч, миллионов и т.д., подчеркиванием.
output_format_pretty_highlight_trailing_spaces
Тип: Bool
Значение по умолчанию: 1
Если включено и если вывод идет в терминал, выделять конечные пробелы серым цветом и подчеркиванием.
output_format_pretty_max_column_name_width_cut_to
Тип: UInt64
Значение по умолчанию: 24
Если название колонки слишком длинное, сократить его до этой длины.
Колонка будет сокращена, если она длиннее, чем output_format_pretty_max_column_name_width_cut_to
плюс output_format_pretty_max_column_name_width_min_chars_to_cut
.
output_format_pretty_max_column_name_width_min_chars_to_cut
Тип: UInt64
Значение по умолчанию: 4
Минимальное количество символов для обрезки, если название колонки слишком длинное.
Колонка будет сокращена, если она длиннее, чем output_format_pretty_max_column_name_width_cut_to
плюс output_format_pretty_max_column_name_width_min_chars_to_cut
.
output_format_pretty_max_column_pad_width
Тип: UInt64
Значение по умолчанию: 250
Максимальная ширина для добавления всех значений в колонке в форматах Pretty.
output_format_pretty_max_rows
Тип: UInt64
Значение по умолчанию: 1000
Ограничение на количество строк для форматов Pretty.
output_format_pretty_max_value_width
Тип: UInt64
Значение по умолчанию: 10000
Максимальная ширина значения для отображения в форматах Pretty. Если больше - оно будет обрезано. Значение 0 означает - никогда не обрезать.
output_format_pretty_max_value_width_apply_for_single_value
Тип: UInt64
Значение по умолчанию: 0
Обрезать значения (см. настройку output_format_pretty_max_value_width
) только в том случае, если это не единственное значение в блоке. В противном случае выводить его полностью, что полезно для запроса SHOW CREATE TABLE
.
output_format_pretty_multiline_fields
Тип: Bool
Значение по умолчанию: 1
Если включено, форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, чтобы контур таблицы был сохранен. Если нет, они будут отображаться как есть, что может исказить таблицу (одним из преимуществ отключения является то, что копирование и вставка многострочных значений будет проще).
output_format_pretty_row_numbers
Тип: Bool
Значение по умолчанию: 1
Добавить номера строк перед каждой строкой для форматируемого вывода.
output_format_pretty_single_large_number_tip_threshold
Тип: UInt64
Значение по умолчанию: 1000000
Вывести заметку о читаемом числе справа от таблицы, если блок состоит из одного числа, которое превышает это значение (кроме 0).
output_format_pretty_squash_consecutive_ms
Тип: UInt64
Значение по умолчанию: 50
Ждать следующий блок до указанного количества миллисекунд и объединять его с предыдущим перед записью. Это избегает частого вывода слишком маленьких блоков, но все равно позволяет отображать данные в потоковом режиме.
output_format_pretty_squash_max_wait_ms
Тип: UInt64
Значение по умолчанию: 1000
Выводить ожидающий блок в форматах Pretty, если прошло более указанного количества миллисекунд с последнего вывода.
output_format_protobuf_nullables_with_google_wrappers
Тип: Bool
Значение по умолчанию: 0
При сериализации Nullable колонок с обертками Google, сериализовать значения по умолчанию как пустые обертки. Если отключено, значения по умолчанию и null не сериализуются.
output_format_schema
Тип: String
Значение по умолчанию:
Путь к файлу, в который будет сохранена автоматически сгенерированная схема в форматах Cap'n Proto или Protobuf.
output_format_sql_insert_include_column_names
Тип: Bool
Значение по умолчанию: 1
Включить названия колонок в запрос INSERT.
output_format_sql_insert_max_batch_size
Тип: UInt64
Значение по умолчанию: 65409
Максимальное количество строк в одном выражении INSERT.
output_format_sql_insert_quote_names
Тип: Bool
Значение по умолчанию: 1
Обрамлять названия колонок символами '`'.
output_format_sql_insert_table_name
Тип: String
Значение по умолчанию: table
Название таблицы в выходном запросе INSERT.
output_format_sql_insert_use_replace
Тип: Bool
Значение по умолчанию: 0
Использовать оператор REPLACE вместо INSERT.
output_format_tsv_crlf_end_of_line
Тип: Bool
Значение по умолчанию: 0
Если установлено в true, конец строки в формате TSV будет \r\n вместо \n.
output_format_values_escape_quote_with_quote
Тип: Bool
Значение по умолчанию: 0
Если true, экранировать ' с '', иначе обрамлять с \'
output_format_write_statistics
Тип: Bool
Значение по умолчанию: 1
Записывать статистику о прочитанных строках, байтах, времени, затраченном в подходящих форматах вывода.
Включено по умолчанию.
precise_float_parsing
Тип: Bool
Значение по умолчанию: 0
Предпочитать более точный (но медленный) алгоритм разбора с плавающей точкой.
regexp_dict_allow_hyperscan
Тип: Bool
Значение по умолчанию: 1
Разрешить использование словаря regexp_tree с библиотекой Hyperscan.
regexp_dict_flag_case_insensitive
Тип: Bool
Значение по умолчанию: 0
Использовать нечувствительное к регистру совпадение для словаря regexp_tree. Может быть переопределено в отдельных выражениях с помощью (?i) и (?-i).
regexp_dict_flag_dotall
Тип: Bool
Значение по умолчанию: 0
Разрешить '.' соответствовать символам новой строки для словаря regexp_tree.
rows_before_aggregation
Тип: Bool
Значение по умолчанию: 0
При включении ClickHouse предоставит точное значение для статистики rows_before_aggregation, представляющее количество строк, прочитанных перед агрегацией.
schema_inference_hints
Тип: String
Значение по умолчанию:
Список названий колонок и типов, которые будут использоваться в качестве подсказок в выводе схемы для форматов без схемы.
Пример:
Запрос:
Результат:
Если schema_inference_hints
форматирован неправильно, или если есть опечатка или неверный тип данных и т.д... весь schema_inference_hints будет проигнорирован.
schema_inference_make_columns_nullable
Тип: UInt64Auto
Значение по умолчанию: 1
Управляет тем, чтобы подразумеваемые типы были Nullable
в выводе схемы.
Если установка включена, все подразумеваемые типы будут Nullable
, если отключена, подразумеваемый тип никогда не будет Nullable
, если установлена auto
, подразумеваемый тип будет Nullable
только если колонка содержит NULL
в выборке, которая парсится во время вывода схемы, или метаданные файла содержат информацию о допустимости null для колонки.
schema_inference_make_json_columns_nullable
Тип: Bool
Значение по умолчанию: 0
Управляет тем, чтобы подразумеваемые JSON типы были Nullable
в выводе схемы.
Если эта настройка включена вместе с schema_inference_make_columns_nullable, подразумеваемый JSON тип будет Nullable
.
schema_inference_mode
Тип: SchemaInferenceMode
Значение по умолчанию: default
Режим вывода схемы. 'default' - предположить, что все файлы имеют одну и ту же схему и схема может быть выведена из любого файла, 'union' - файлы могут иметь разные схемы и результатирующая схема должна быть объединением схем всех файлов.
show_create_query_identifier_quoting_rule
Тип: IdentifierQuotingRule
Значение по умолчанию: when_necessary
Установить правило обрамления для идентификаторов в запросе SHOW CREATE.
show_create_query_identifier_quoting_style
Тип: IdentifierQuotingStyle
Значение по умолчанию: Backticks
Установить стиль обрамления для идентификаторов в запросе SHOW CREATE.
type_json_skip_duplicated_paths
Тип: Bool
Значение по умолчанию: 0
При включении, при разборе JSON-объекта в тип JSON дубликаты путей будут игнорироваться, и только первый будет вставлен вместо исключения.
validate_experimental_and_suspicious_types_inside_nested_types
Тип: Bool
Значение по умолчанию: 1
Проверить использование экспериментальных и подозрительных типов внутри вложенных типов, таких как Array/Map/Tuple.