Перейти к основному содержимому
Перейти к основному содержимому

Настройки форматов

Эти настройки автоматически сгенерированы из source.

bool_false_representation

Type: String

Default value: false

Текст для представления значения логического типа false в форматах TSV/CSV/Vertical/Pretty.

bool_true_representation

Type: String

Default value: true

Текст для представления значения логического типа true в форматах TSV/CSV/Vertical/Pretty.

column_names_for_schema_inference

Type: String

Default value:

Список имён колонок для использования в выводе схемы для форматов без имён колонок. Формат: 'column1,column2,column3,...'

cross_to_inner_join_rewrite

Type: UInt64

Default value: 1

Использовать внутреннее соединение вместо запятой/перекрестного соединения, если в секции WHERE есть выражения для соединения. Значения: 0 - без переписывания, 1 - применять, если возможно для запятой/перекрестного, 2 - принудительное переписывание всех запятой, перекрестное - если возможно

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

Type: Bool

Default value: 0

Динамически обрезать конечные нули значений datetime64, чтобы отрегулировать масштаб вывода к [0, 3, 6], соответствующему 'секундам', 'миллисекундам' и 'микросекундам'

date_time_input_format

Type: DateTimeInputFormat

Default value: basic

Позволяет выбрать парсер текстового представления даты и времени.

Этот параметр не применяется к функциям даты и времени.

Возможные значения:

  • 'best_effort' — Включает расширенное парсинг.

    ClickHouse может парсить базовый формат YYYY-MM-DD HH:MM:SS и все форматы даты и времени ISO 8601. Например, '2018-06-08T01:02:03.000Z'.

  • 'basic' — Использовать базовый парсер.

    ClickHouse может парсить только базовый формат YYYY-MM-DD HH:MM:SS или YYYY-MM-DD. Например, 2019-08-20 10:18:56 или 2019-08-20.

Cloud default value: 'best_effort'.

Смотрите также:

date_time_output_format

Type: DateTimeOutputFormat

Default value: simple

Позволяет выбирать различные выходные форматы текстового представления даты и времени.

Возможные значения:

  • simple - Простой выходной формат.

    ClickHouse выводит дату и время в формате YYYY-MM-DD hh:mm:ss. Например, 2019-08-20 10:18:56. Расчеты выполняются в соответствии с временной зоной типа данных (если присутствует) или временной зоной сервера.

  • iso - ISO выходной формат.

    ClickHouse выводит дату и время в формате ISO 8601 YYYY-MM-DDThh:mm:ssZ. Например, 2019-08-20T10:18:56Z. Обратите внимание, что вывод в UTC (Z означает UTC).

  • unix_timestamp - Выходной формат Unix timestamp.

    ClickHouse выводит дату и время в формате Unix timestamp. Например 1566285536.

Смотрите также:

date_time_overflow_behavior

Type: DateTimeOverflowBehavior

Default value: ignore

Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в целевом типе.

Возможные значения:

  • ignore — Тихо игнорировать переполнения. Результаты неопределены.
  • throw — Вызывать исключение в случае переполнения.
  • saturate — Насыщать результат. Если значение меньше наименьшего значения, которое может быть представлено целевым типом, выбирается наименьшее представимое значение. Если значение больше наибольшего значения, которое может быть представлено целевым типом, выбирается наибольшее представимое значение.

Default value: ignore.

dictionary_use_async_executor

Type: Bool

Default value: 0

Выполнять конвейер для чтения источника словаря в нескольких потоках. Это поддерживается только для словарей с локальным источником CLICKHOUSE.

errors_output_format

Type: String

Default value: CSV

Метод для записи ошибок в текстовый вывод.

exact_rows_before_limit

Type: Bool

Default value: 0

При включении ClickHouse предоставит точное значение для статистики rows_before_limit_at_least, но с тем ценой, что данные перед лимитом нужно будет прочитать полностью

format_avro_schema_registry_url

Type: URI

Default value:

Для формата AvroConfluent: URL реестра схем Confluent.

format_binary_max_array_size

Type: UInt64

Default value: 1073741824

Максимально допустимый размер для массива в формате RowBinary. Он предотвращает выделение большого количества памяти в случае поврежденных данных. 0 означает, что ограничений нет

format_binary_max_string_size

Type: UInt64

Default value: 1073741824

Максимально допустимый размер для строки в формате RowBinary. Он предотвращает выделение большого количества памяти в случае поврежденных данных. 0 означает, что ограничений нет

format_capn_proto_enum_comparising_mode

Type: CapnProtoEnumComparingMode

Default value: by_values

Как сопоставить ClickHouse Enum и CapnProto Enum

format_capn_proto_use_autogenerated_schema

Type: Bool

Default value: 1

Использовать автоматически сгенерированную схему CapnProto, когда format_schema не задан

format_csv_allow_double_quotes

Type: Bool

Default value: 1

Если установлено в true, разрешить строки в двойных кавычках.

format_csv_allow_single_quotes

Type: Bool

Default value: 0

Если установлено в true, разрешить строки в одинарных кавычках.

format_csv_delimiter

Type: Char

Default value: ,

Символ, который будет считаться разделителем в данных CSV. Если установка представляет собой строку, длина строки должна быть 1.

format_csv_null_representation

Type: String

Default value: \N

Пользовательское представление NULL в формате CSV

format_custom_escaping_rule

Type: EscapingRule

Default value: Escaped

Правило экранирования полей (для формата CustomSeparated)

format_custom_field_delimiter

Type: String

Default value:

Разделитель между полями (для формата CustomSeparated)

format_custom_result_after_delimiter

Type: String

Default value:

Суффикс после набора результатов (для формата CustomSeparated)

format_custom_result_before_delimiter

Type: String

Default value:

Префикс перед набором результатов (для формата CustomSeparated)

format_custom_row_after_delimiter

Type: String

Default value:

Разделитель после поля последней колонки (для формата CustomSeparated)

format_custom_row_before_delimiter

Type: String

Default value:

Разделитель перед полем первой колонки (для формата CustomSeparated)

format_custom_row_between_delimiter

Type: String

Default value:

Разделитель между строками (для формата CustomSeparated)

format_display_secrets_in_show_and_select

Type: Bool

Default value: 0

Включает или отключает отображение секретов в запросах SHOW и SELECT для таблиц, баз данных, таблиц функций и словарей.

Пользователь, желающий видеть секреты, также должен иметь display_secrets_in_show_and_select server setting включённым и иметь привилегию displaySecretsInShowAndSelect.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

format_json_object_each_row_column_for_object_name

Type: String

Default value:

Имя колонки, которое будет использоваться для хранения/записи имён объектов в JSONObjectEachRow формате. Тип колонки должен быть String. Если значение пустое, будут использоваться имена по умолчанию row_{i}.

input_format_json_compact_allow_variable_number_of_columns

Разрешить переменное количество колонок в строках в JSONCompact/JSONCompactEachRow входных форматах. Игнорировать дополнительные колонки в строках с большим количеством колонок, чем ожидается, и рассматривать отсутствующие колонки как значения по умолчанию.

Отключено по умолчанию.

output_format_markdown_escape_special_characters

При включении экранировать специальные символы в Markdown.

Common Mark определяет следующие специальные символы, которые могут быть экранированы с помощью :

Возможные значения:

  • 0 — Отключение.
  • 1 — Включение.

input_format_json_empty_as_default

При включении заменять пустые входные поля в JSON на значения по умолчанию. Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields также должно быть включено.

Возможные значения:

  • 0 — Отключить.
  • 1 — Включить.

format_protobuf_use_autogenerated_schema

Type: Bool

Default value: 1

Использовать автоматически сгенерированный Protobuf, когда format_schema не установлен

format_regexp

Type: String

Default value:

Регулярное выражение (для формата Regexp)

format_regexp_escaping_rule

Type: EscapingRule

Default value: Raw

Правило экранирования полей (для формата Regexp)

format_regexp_skip_unmatched

Type: Bool

Default value: 0

Пропускать строки, не соответствующие регулярному выражению (для формата Regexp)

format_schema

Type: String

Default value:

Этот параметр полезен, когда вы используете форматы, требующие определения схемы, такие как Cap'n Proto или Protobuf. Значение зависит от формата.

format_template_resultset

Type: String

Default value:

Путь к файлу, содержащему строку формата для набора результатов (для формата Template)

format_template_resultset_format

Type: String

Default value:

Строка формата для набора результатов (для формата Template)

format_template_row

Type: String

Default value:

Путь к файлу, содержащему строку формата для строк (для формата Template)

format_template_row_format

Type: String

Default value:

Строка формата для строк (для формата Template)

format_template_rows_between_delimiter

Type: String

Default value:

Разделитель между строками (для формата Template)

format_tsv_null_representation

Type: String

Default value: \N

Пользовательское представление NULL в формате TSV

input_format_allow_errors_num

Type: UInt64

Default value: 0

Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т. д.).

Значение по умолчанию — 0.

Всегда используйте в сочетании с input_format_allow_errors_ratio.

Если возникла ошибка при чтении строк, но счётчик ошибок всё ещё меньше, чем input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей.

Если одновременно превышены input_format_allow_errors_num и input_format_allow_errors_ratio, ClickHouse выбрасывает исключение.

input_format_allow_errors_ratio

Type: Float

Default value: 0

Устанавливает максимальный процент ошибок, допустимых при чтении из текстовых форматов (CSV, TSV и т. д.). Процент ошибок задаётся в виде числа с плавающей запятой между 0 и 1.

Значение по умолчанию — 0.

Всегда используйте в сочетании с input_format_allow_errors_num.

Если возникла ошибка при чтении строк, но счётчик ошибок всё ещё меньше, чем input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей.

Если одновременно превышены input_format_allow_errors_num и input_format_allow_errors_ratio, ClickHouse выбрасывает исключение.

input_format_allow_seeks

Type: Bool

Default value: 1

Разрешить позиционирование при чтении в ORC/Parquet/Arrow входных форматах.

Включено по умолчанию.

input_format_arrow_allow_missing_columns

Type: Bool

Default value: 1

Разрешить отсутствие колонок при чтении Arrow входных форматов

input_format_arrow_case_insensitive_column_matching

Type: Bool

Default value: 0

Игнорировать регистр при сопоставлении колонок Arrow с колонками CH.

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

Type: Bool

Default value: 0

Пропускать колонки с неподдерживаемыми типами при выводе схемы для формата Arrow

input_format_avro_allow_missing_fields

Type: Bool

Default value: 0

Для формата Avro/AvroConfluent: когда поле не найдено в схеме, используйте значение по умолчанию вместо ошибки

input_format_avro_null_as_default

Type: Bool

Default value: 0

Для формата Avro/AvroConfluent: вставить значение по умолчанию в случае null и не Nullable колонок

input_format_binary_decode_types_in_binary_format

Type: Bool

Default value: 0

Читать типы данных в бинарном формате вместо имён типов в RowBinaryWithNamesAndTypes входном формате

input_format_binary_read_json_as_string

Type: Bool

Default value: 0

Читать значения типа JSON как значения типа JSON String в RowBinary входном формате.

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

Type: Bool

Default value: 0

Пропускать поля с неподдерживаемыми типами при выводе схемы для формата BSON.

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

Type: Bool

Default value: 0

Пропускать колонки с неподдерживаемыми типами при выводе схемы для формата CapnProto

input_format_csv_allow_cr_end_of_line

Type: Bool

Default value: 0

Если установлено в true, \r будет разрешён в конце строки, не следующей за \n

input_format_csv_allow_variable_number_of_columns

Type: Bool

Default value: 0

Игнорировать дополнительные колонки в CSV входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в CSV входных данных как значения по умолчанию

input_format_csv_allow_whitespace_or_tab_as_delimiter

Type: Bool

Default value: 0

Разрешить использовать пробелы и табуляции (\t) в качестве разделителей полей в CSV строках

input_format_csv_arrays_as_nested_csv

Type: Bool

Default value: 0

При чтении массива из CSV ожидать, что его элементы были сериализованы в вложенный CSV и затем помещены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Скобки вокруг массива могут быть опущены.

input_format_csv_deserialize_separate_columns_into_tuple

Type: Bool

Default value: 1

Если установлено в true, тогда отдельные колонки, записанные в формате CSV, могут быть десериализованы в колонку Tuple.

input_format_csv_detect_header

Type: Bool

Default value: 1

Автоматически обнаруживать заголовок с именами и типами в формате CSV

input_format_csv_empty_as_default

Type: Bool

Default value: 1

Рассматривать пустые поля в CSV входных данных как значения по умолчанию.

input_format_csv_enum_as_number

Type: Bool

Default value: 0

Рассматривать вставленные значения enum в CSV форматах как индексы enum

input_format_csv_skip_first_lines

Type: UInt64

Default value: 0

Пропускать указанное количество строк в начале данных в CSV формате

input_format_csv_skip_trailing_empty_lines

Type: Bool

Default value: 0

Пропускать конечные пустые строки в CSV формате

input_format_csv_trim_whitespaces

Type: Bool

Default value: 1

Удалять пробелы и символы табуляции (\t) в начале и конце строк в CSV строках

input_format_csv_try_infer_numbers_from_strings

Type: Bool

Default value: 0

Если включено, при выводе схемы ClickHouse попытается вывести числа из строковых полей. Это может быть полезно, если данные CSV содержат заключённые в кавычки числа UInt64.

Отключено по умолчанию.

input_format_csv_try_infer_strings_from_quoted_tuples

Type: Bool

Default value: 1

Интерпретировать заключённые в кавычки кортежи в входных данных как значение типа String.

input_format_csv_use_best_effort_in_schema_inference

Type: Bool

Default value: 1

Использовать некоторые настройки и эвристики для вывода схемы в CSV формате

input_format_csv_use_default_on_bad_values

Type: Bool

Default value: 0

Позволить установить значение по умолчанию для колонки, когда десериализация поля CSV завершилась неудачей из-за неверного значения

input_format_custom_allow_variable_number_of_columns

Type: Bool

Default value: 0

Игнорировать дополнительные колонки в формате CustomSeparated (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в формате CustomSeparated как значения по умолчанию

input_format_custom_detect_header

Type: Bool

Default value: 1

Автоматически обнаруживать заголовок с именами и типами в формате CustomSeparated

input_format_custom_skip_trailing_empty_lines

Type: Bool

Default value: 0

Пропускать конечные пустые строки в формате CustomSeparated

input_format_defaults_for_omitted_fields

Type: Bool

Default value: 1

При выполнении запросов INSERT заменять пропущенные значения столбцов на значения по умолчанию соответствующих столбцов. Эта опция применяется к JSONEachRow (и другим JSON форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native форматам и форматам с суффиксами WithNames/WithNamesAndTypes.

примечание

Когда эта опция включена, расширенная метаданные таблицы отправляются от сервера к клиенту. Это потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

input_format_force_null_for_omitted_fields

Type: Bool

Default value: 0

Принудительно инициализировать пропущенные поля нулевыми значениями

input_format_hive_text_allow_variable_number_of_columns

Type: Bool

Default value: 1

Игнорировать дополнительные колонки в Hive Text входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в Hive Text входных данных как значения по умолчанию

input_format_hive_text_collection_items_delimiter

Type: Char

Default value: 

Разделитель между элементами коллекции (массива или карты) в Hive Text файле

input_format_hive_text_fields_delimiter

Type: Char

Default value: 

Разделитель между полями в Hive Text файле

input_format_hive_text_map_keys_delimiter

Type: Char

Default value: 

Разделитель между парой ключ/значение карты в Hive Text файле

input_format_import_nested_json

Type: Bool

Default value: 0

Включает или отключает вставку данных JSON с вложенными объектами.

Поддерживаемые форматы:

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

Смотрите также:

input_format_ipv4_default_on_conversion_error

Type: Bool

Default value: 0

Десериализация IPv4 будет использовать значения по умолчанию вместо генерации исключения при ошибке преобразования.

Отключено по умолчанию.

input_format_ipv6_default_on_conversion_error

Type: Bool

Default value: 0

Десериализация IPV6 будет использовать значения по умолчанию вместо генерации исключения при ошибке преобразования.

Отключено по умолчанию.

input_format_json_compact_allow_variable_number_of_columns

Type: Bool

Default value: 0

Игнорировать дополнительные колонки в JSONCompact(EachRow) входных данных (если в файле больше колонок, чем ожидалось) и рассматривать отсутствующие поля в JSONCompact(EachRow) входных данных как значения по умолчанию

input_format_json_defaults_for_missing_elements_in_named_tuple

Type: Bool

Default value: 1

Вставить значения по умолчанию для отсутствующих элементов в JSON объекте при разборе именованного кортежа. Эта настройка работает только при включении настройки input_format_json_named_tuples_as_objects.

Включено по умолчанию.

input_format_json_empty_as_default

Type: Bool

Default value: 0

Рассматривать пустые поля во входном JSON как значения по умолчанию.

input_format_json_ignore_unknown_keys_in_named_tuple

Type: Bool

Default value: 1

Игнорировать неизвестные ключи в JSON объекте для именованных кортежей.

Включено по умолчанию.

input_format_json_ignore_unnecessary_fields

Type: Bool

Default value: 1

Игнорировать ненужные поля и не разбирать их. Включение этого может не вызвать исключения на JSON строках неверного формата или с дублированными полями

input_format_json_infer_incomplete_types_as_strings

Type: Bool

Default value: 1

Разрешить использование типа String для JSON ключей, которые содержат только Null/{}/[] в выборке данных при выводе схемы. В форматах JSON любое значение может быть прочитано как String, и мы можем избежать ошибок, таких как Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps при выводе схемы используя тип String для ключей с неизвестными типами.

Пример:

Результат:

Включено по умолчанию.

input_format_json_max_depth

Type: UInt64

Default value: 1000

Максимальная глубина поля в JSON. Это не строгое ограничение, оно не обязательно должно применяться точно.

input_format_json_named_tuples_as_objects

Type: Bool

Default value: 1

Разбирать столбцы именованных кортежей как JSON объекты.

Включено по умолчанию.

input_format_json_read_arrays_as_strings

Type: Bool

Default value: 1

Разрешить разбор JSON массивов как строк в форматах входного JSON.

Пример:

Результат:

Включено по умолчанию.

input_format_json_read_bools_as_numbers

Type: Bool

Default value: 1

Разрешить разбор логических значений как чисел в форматах входного JSON.

Включено по умолчанию.

input_format_json_read_bools_as_strings

Type: Bool

Default value: 1

Разрешить разбор логических значений как строк в форматах входного JSON.

Включено по умолчанию.

input_format_json_read_numbers_as_strings

Type: Bool

Default value: 1

Разрешить разбор чисел как строк в форматах входного JSON.

Включено по умолчанию.

input_format_json_read_objects_as_strings

Type: Bool

Default value: 1

Разрешить разбор JSON объектов как строк в форматах входного JSON.

Пример:

Результат:

Включено по умолчанию.

input_format_json_throw_on_bad_escape_sequence

Type: Bool

Default value: 1

Вызывать исключение, если JSON строка содержит неправильную последовательность экранирования в форматах входного JSON. Если отключено, неправильные последовательности экранирования останутся как есть в данных.

Включено по умолчанию.

input_format_json_try_infer_named_tuples_from_objects

Type: Bool

Default value: 1

Если включено, при выводе схемы ClickHouse попытается вывести именованный кортеж из JSON объектов. Полученный именованный кортеж будет содержать все элементы из всех соответствующих JSON объектов из выборки данных.

Пример:

Результат:

Включено по умолчанию.

input_format_json_try_infer_numbers_from_strings

Type: Bool

Default value: 0

Если включено, при выводе схемы ClickHouse попытается вывести числа из строковых полей. Это может быть полезно, если данные JSON содержат заключённые в кавычки числа UInt64.

Отключено по умолчанию.

input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects {#input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects

Type: Bool

Default value: 0

Используйте тип String вместо исключения в случае неоднозначных путей в JSON объектах при выводе именованных кортежей.

Результат:

Пример запроса с отключенной настройкой

Запрос:

Результат:

output_format_json_escape_forward_slashes

Тип: Bool

Значение по умолчанию: 1

Контролирует экранирование косых черт для строковых выводов в формате JSON. Это предназначено для совместимости с JavaScript. Не путать с обратными слешами, которые всегда экранируются.

Включено по умолчанию.

output_format_json_named_tuples_as_objects

Тип: Bool

Значение по умолчанию: 1

Сериализовать колонки именованных кортежей как объекты JSON.

Включено по умолчанию.

output_format_json_pretty_print

Тип: Bool

Значение по умолчанию: 1

Когда включено, значения сложных типов данных, таких как Tuple/Array/Map, в формате JSON в разделе 'data' будут печататься в удобочитаемом формате.

Включено по умолчанию.

output_format_json_quote_64bit_floats

Тип: Bool

Значение по умолчанию: 0

Контролирует экранирование 64-битных чисел с плавающей запятой при их выводе в форматах JSON.

Отключено по умолчанию.

output_format_json_quote_64bit_integers

Тип: Bool

Значение по умолчанию: 1

Контролирует экранирование 64-битных или больших целых чисел (таких как UInt64 или Int128) при их выводе в формате JSON. Такие целые числа по умолчанию заключены в кавычки. Это поведение совместимо с большинством реализаций JavaScript.

Возможные значения:

  • 0 — Целые числа выводятся без кавычек.
  • 1 — Целые числа заключаются в кавычки.

output_format_json_quote_decimals

Тип: Bool

Значение по умолчанию: 0

Контролирует экранирование десятичных значений в форматах JSON.

Отключено по умолчанию.

output_format_json_quote_denormals

Тип: Bool

Значение по умолчанию: 0

Включает вывод +nan, -nan, +inf, -inf в формате JSON.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

Пример

Рассмотрим следующую таблицу account_orders:

Когда output_format_json_quote_denormals = 0, запрос возвращает null значения в выводе:

Когда output_format_json_quote_denormals = 1, запрос возвращает:

output_format_json_skip_null_value_in_named_tuples

Тип: Bool

Значение по умолчанию: 0

Пропускать ключевые пары со значением null при сериализации колонок именованных кортежей как объектов JSON. Это действительно только в том случае, если output_format_json_named_tuples_as_objects истинно.

output_format_json_validate_utf8

Тип: Bool

Значение по умолчанию: 0

Контролирует валидацию последовательностей UTF-8 в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, они всегда валидируют UTF-8.

Отключено по умолчанию.

output_format_markdown_escape_special_characters

Тип: Bool

Значение по умолчанию: 0

Экранировать специальные символы в формате Markdown.

output_format_msgpack_uuid_representation

Тип: MsgPackUUIDRepresentation

Значение по умолчанию: ext

Способ вывода UUID в формате MsgPack.

output_format_native_encode_types_in_binary_format

Тип: Bool

Значение по умолчанию: 0

Записывать типы данных в бинарном формате вместо имён типов в родном формате вывода.

output_format_native_write_json_as_string

Тип: Bool

Значение по умолчанию: 0

Записывать данные колонки JSON как колонку String, содержащую JSON строки вместо стандартной сериализации JSON по умолчанию.

output_format_orc_compression_method

Тип: ORCCompression

Значение по умолчанию: zstd

Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (не сжатый).

output_format_orc_dictionary_key_size_threshold

Тип: Double

Значение по умолчанию: 0

Для строковой колонки в формате ORC, если количество различных значений превышает эту долю от общего количества ненулевых строк, отключить кодирование словарей. В противном случае включается кодирование словарей.

output_format_orc_row_index_stride

Тип: UInt64

Значение по умолчанию: 10000

Целевой шаг индекса строк в формате ORC.

output_format_orc_string_as_string

Тип: Bool

Значение по умолчанию: 1

Использовать тип ORC String вместо Binary для колонок String.

output_format_orc_writer_time_zone_name

Тип: String

Значение по умолчанию: GMT

Имя часового пояса для записи ORC, часовой пояс по умолчанию для записи ORC — GMT.

output_format_parquet_batch_size

Тип: UInt64

Значение по умолчанию: 1024

Проверить размер страницы каждые определённое количество строк. Рассмотрите возможность уменьшения, если у вас есть колонки со средним размером значений более нескольких КБ.

output_format_parquet_bloom_filter_bits_per_value

Тип: Double

Значение по умолчанию: 10.5

Приблизительное количество бит, которое нужно использовать для каждого уникального значения в bloom фильтрах parquet. Оценка вероятности ложных срабатываний:

  • 6 бит - 10%
  • 10.5 бит - 1%
  • 16.9 бит - 0.1%
  • 26.4 бит - 0.01%
  • 41 бит - 0.001%

output_format_parquet_bloom_filter_flush_threshold_bytes

Тип: UInt64

Значение по умолчанию: 134217728

Где в файле parquet разместить bloom фильтры. Bloom фильтры будут записываться группами примерно этого размера. В частности:

  • если 0, bloom фильтры каждой группы строк записываются сразу после группы строк,
  • если больше общего размера всех bloom фильтров, bloom фильтры для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
  • в противном случае, bloom фильтры будут накапливаться в памяти и записываться, когда их общий размер превысит это значение.

output_format_parquet_compliant_nested_types

Тип: Bool

Значение по умолчанию: 1

В схеме файла parquet используйте имя 'element' вместо 'item' для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В общем, это увеличивает совместимость, кроме, возможно, с некоторыми старыми версиями Arrow.

output_format_parquet_compression_method

Тип: ParquetCompression

Значение по умолчанию: zstd

Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (не сжатый).

output_format_parquet_data_page_size

Тип: UInt64

Значение по умолчанию: 1048576

Целевой размер страницы в байтах, перед сжатием.

output_format_parquet_datetime_as_uint32

Тип: Bool

Значение по умолчанию: 0

Записывать значения DateTime как необработанные метки времени Unix (читать как UInt32), вместо преобразования в миллисекунды (читать как DateTime64(3)).

output_format_parquet_fixed_string_as_fixed_byte_array

Тип: Bool

Значение по умолчанию: 1

Использовать тип Parquet FIXED_LENGTH_BYTE_ARRAY вместо Binary для колонок FixedString.

output_format_parquet_parallel_encoding

Тип: Bool

Значение по умолчанию: 1

Выполнять кодирование Parquet в нескольких потоках. Требуется output_format_parquet_use_custom_encoder.

output_format_parquet_row_group_size

Тип: UInt64

Значение по умолчанию: 1000000

Целевой размер группы строк в строках.

output_format_parquet_row_group_size_bytes

Тип: UInt64

Значение по умолчанию: 536870912

Целевой размер группы строк в байтах, до сжатия.

output_format_parquet_string_as_string

Тип: Bool

Значение по умолчанию: 1

Использовать тип строк Parquet вместо Binary для колонок строк.

output_format_parquet_use_custom_encoder

Тип: Bool

Значение по умолчанию: 1

Использовать более быструю реализацию кодировщика Parquet.

output_format_parquet_version

Тип: ParquetVersion

Значение по умолчанию: 2.latest

Версия формата Parquet для формата вывода. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.latest (по умолчанию).

output_format_parquet_write_bloom_filter

Тип: Bool

Значение по умолчанию: 1

Записывать фильтры Блума в файлы parquet. Требуется output_format_parquet_use_custom_encoder = true.

output_format_parquet_write_page_index

Тип: Bool

Значение по умолчанию: 1

Записывать индекс колонок и индекс смещения (т.е. статистику о каждой странице данных, которая может использоваться для фильтров на чтение) в файлы parquet.

output_format_pretty_color

Тип: UInt64Auto

Значение по умолчанию: auto

Использовать последовательности управляемых ANSI в формате Pretty. 0 - отключено, 1 - включено, 'auto' - включено, если это терминал.

Тип: UInt64

Значение по умолчанию: 1

Отображать названия колонок в нижнем колонтитуле, если есть много строк таблицы.

Возможные значения:

  • 0 — Названия колонок не отображаются в нижнем колонтитуле.
  • 1 — Названия колонок отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, установленному в output_format_pretty_display_footer_column_names_min_rows (по умолчанию 50).

Пример

Запрос:

Результат:

Тип: UInt64

Значение по умолчанию: 50

Устанавливает минимальное количество строк, для которых нижний колонтитул с названиями колонок будет отображаться, если установка output_format_pretty_display_footer_column_names включена.

output_format_pretty_fallback_to_vertical

Тип: Bool

Значение по умолчанию: 1

Если включено, и таблица широкая, но короткая, формат Pretty выведет её в том же формате, что и вертикальный формат. Смотрите output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width для подробной настройки этого поведения.

output_format_pretty_fallback_to_vertical_max_rows_per_chunk

Тип: UInt64

Значение по умолчанию: 10

Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical) будет активирован только если количество записей в блоке не превышает указанное значение.

output_format_pretty_fallback_to_vertical_min_columns

Тип: UInt64

Значение по умолчанию: 5

Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical) будет активирован только если количество колонок больше указанного значения.

output_format_pretty_fallback_to_vertical_min_table_width

Тип: UInt64

Значение по умолчанию: 250

Возврат к вертикальному формату (см. output_format_pretty_fallback_to_vertical) будет активирован только если сумма длин колонок в таблице составляет не менее указанного значения, или если хотя бы одно значение содержит перенос строки.

output_format_pretty_grid_charset

Тип: String

Значение по умолчанию: UTF-8

Кодировка для печати границ сетки. Доступные кодировки: ASCII, UTF-8 (по умолчанию).

output_format_pretty_highlight_digit_groups

Тип: Bool

Значение по умолчанию: 1

Если включено и если вывод идет в терминал, выделять каждую цифру, соответствующую количеству тысяч, миллионов и т.д., подчеркиванием.

output_format_pretty_highlight_trailing_spaces

Тип: Bool

Значение по умолчанию: 1

Если включено и если вывод идет в терминал, выделять конечные пробелы серым цветом и подчеркиванием.

output_format_pretty_max_column_name_width_cut_to

Тип: UInt64

Значение по умолчанию: 24

Если название колонки слишком длинное, сократить его до этой длины. Колонка будет сокращена, если она длиннее, чем output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_name_width_min_chars_to_cut

Тип: UInt64

Значение по умолчанию: 4

Минимальное количество символов для обрезки, если название колонки слишком длинное. Колонка будет сокращена, если она длиннее, чем output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_pad_width

Тип: UInt64

Значение по умолчанию: 250

Максимальная ширина для добавления всех значений в колонке в форматах Pretty.

output_format_pretty_max_rows

Тип: UInt64

Значение по умолчанию: 1000

Ограничение на количество строк для форматов Pretty.

output_format_pretty_max_value_width

Тип: UInt64

Значение по умолчанию: 10000

Максимальная ширина значения для отображения в форматах Pretty. Если больше - оно будет обрезано. Значение 0 означает - никогда не обрезать.

output_format_pretty_max_value_width_apply_for_single_value

Тип: UInt64

Значение по умолчанию: 0

Обрезать значения (см. настройку output_format_pretty_max_value_width) только в том случае, если это не единственное значение в блоке. В противном случае выводить его полностью, что полезно для запроса SHOW CREATE TABLE.

output_format_pretty_multiline_fields

Тип: Bool

Значение по умолчанию: 1

Если включено, форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, чтобы контур таблицы был сохранен. Если нет, они будут отображаться как есть, что может исказить таблицу (одним из преимуществ отключения является то, что копирование и вставка многострочных значений будет проще).

output_format_pretty_row_numbers

Тип: Bool

Значение по умолчанию: 1

Добавить номера строк перед каждой строкой для форматируемого вывода.

output_format_pretty_single_large_number_tip_threshold

Тип: UInt64

Значение по умолчанию: 1000000

Вывести заметку о читаемом числе справа от таблицы, если блок состоит из одного числа, которое превышает это значение (кроме 0).

output_format_pretty_squash_consecutive_ms

Тип: UInt64

Значение по умолчанию: 50

Ждать следующий блок до указанного количества миллисекунд и объединять его с предыдущим перед записью. Это избегает частого вывода слишком маленьких блоков, но все равно позволяет отображать данные в потоковом режиме.

output_format_pretty_squash_max_wait_ms

Тип: UInt64

Значение по умолчанию: 1000

Выводить ожидающий блок в форматах Pretty, если прошло более указанного количества миллисекунд с последнего вывода.

output_format_protobuf_nullables_with_google_wrappers

Тип: Bool

Значение по умолчанию: 0

При сериализации Nullable колонок с обертками Google, сериализовать значения по умолчанию как пустые обертки. Если отключено, значения по умолчанию и null не сериализуются.

output_format_schema

Тип: String

Значение по умолчанию:

Путь к файлу, в который будет сохранена автоматически сгенерированная схема в форматах Cap'n Proto или Protobuf.

output_format_sql_insert_include_column_names

Тип: Bool

Значение по умолчанию: 1

Включить названия колонок в запрос INSERT.

output_format_sql_insert_max_batch_size

Тип: UInt64

Значение по умолчанию: 65409

Максимальное количество строк в одном выражении INSERT.

output_format_sql_insert_quote_names

Тип: Bool

Значение по умолчанию: 1

Обрамлять названия колонок символами '`'.

output_format_sql_insert_table_name

Тип: String

Значение по умолчанию: table

Название таблицы в выходном запросе INSERT.

output_format_sql_insert_use_replace

Тип: Bool

Значение по умолчанию: 0

Использовать оператор REPLACE вместо INSERT.

output_format_tsv_crlf_end_of_line

Тип: Bool

Значение по умолчанию: 0

Если установлено в true, конец строки в формате TSV будет \r\n вместо \n.

output_format_values_escape_quote_with_quote

Тип: Bool

Значение по умолчанию: 0

Если true, экранировать ' с '', иначе обрамлять с \'

output_format_write_statistics

Тип: Bool

Значение по умолчанию: 1

Записывать статистику о прочитанных строках, байтах, времени, затраченном в подходящих форматах вывода.

Включено по умолчанию.

precise_float_parsing

Тип: Bool

Значение по умолчанию: 0

Предпочитать более точный (но медленный) алгоритм разбора с плавающей точкой.

regexp_dict_allow_hyperscan

Тип: Bool

Значение по умолчанию: 1

Разрешить использование словаря regexp_tree с библиотекой Hyperscan.

regexp_dict_flag_case_insensitive

Тип: Bool

Значение по умолчанию: 0

Использовать нечувствительное к регистру совпадение для словаря regexp_tree. Может быть переопределено в отдельных выражениях с помощью (?i) и (?-i).

regexp_dict_flag_dotall

Тип: Bool

Значение по умолчанию: 0

Разрешить '.' соответствовать символам новой строки для словаря regexp_tree.

rows_before_aggregation

Тип: Bool

Значение по умолчанию: 0

При включении ClickHouse предоставит точное значение для статистики rows_before_aggregation, представляющее количество строк, прочитанных перед агрегацией.

schema_inference_hints

Тип: String

Значение по умолчанию:

Список названий колонок и типов, которые будут использоваться в качестве подсказок в выводе схемы для форматов без схемы.

Пример:

Запрос:

Результат:

примечание

Если schema_inference_hints форматирован неправильно, или если есть опечатка или неверный тип данных и т.д... весь schema_inference_hints будет проигнорирован.

schema_inference_make_columns_nullable

Тип: UInt64Auto

Значение по умолчанию: 1

Управляет тем, чтобы подразумеваемые типы были Nullable в выводе схемы. Если установка включена, все подразумеваемые типы будут Nullable, если отключена, подразумеваемый тип никогда не будет Nullable, если установлена auto, подразумеваемый тип будет Nullable только если колонка содержит NULL в выборке, которая парсится во время вывода схемы, или метаданные файла содержат информацию о допустимости null для колонки.

schema_inference_make_json_columns_nullable

Тип: Bool

Значение по умолчанию: 0

Управляет тем, чтобы подразумеваемые JSON типы были Nullable в выводе схемы. Если эта настройка включена вместе с schema_inference_make_columns_nullable, подразумеваемый JSON тип будет Nullable.

schema_inference_mode

Тип: SchemaInferenceMode

Значение по умолчанию: default

Режим вывода схемы. 'default' - предположить, что все файлы имеют одну и ту же схему и схема может быть выведена из любого файла, 'union' - файлы могут иметь разные схемы и результатирующая схема должна быть объединением схем всех файлов.

show_create_query_identifier_quoting_rule

Тип: IdentifierQuotingRule

Значение по умолчанию: when_necessary

Установить правило обрамления для идентификаторов в запросе SHOW CREATE.

show_create_query_identifier_quoting_style

Тип: IdentifierQuotingStyle

Значение по умолчанию: Backticks

Установить стиль обрамления для идентификаторов в запросе SHOW CREATE.

type_json_skip_duplicated_paths

Тип: Bool

Значение по умолчанию: 0

При включении, при разборе JSON-объекта в тип JSON дубликаты путей будут игнорироваться, и только первый будет вставлен вместо исключения.

validate_experimental_and_suspicious_types_inside_nested_types

Тип: Bool

Значение по умолчанию: 1

Проверить использование экспериментальных и подозрительных типов внутри вложенных типов, таких как Array/Map/Tuple.