跳到主要内容
跳到主要内容

格式设置

这些设置是从 source 自动生成的。

bool_false_representation

类型: 字符串

默认值: false

用于表示 TSV/CSV/Vertical/Pretty 格式中的 false 布尔值的文本。

bool_true_representation

类型: 字符串

默认值: true

用于表示 TSV/CSV/Vertical/Pretty 格式中的 true 布尔值的文本。

column_names_for_schema_inference

类型: 字符串

默认值:

用于无列名称格式的模式推断的列名列表。格式: 'column1,column2,column3,...'

cross_to_inner_join_rewrite

类型: UInt64

默认值: 1

如果 WHERE 部分有连接表达式,则使用内连接代替逗号/交叉连接。值: 0 - 不重写,1 - 如果可能应用于逗号/交叉连接,2 - 强制重写所有逗号连接,交叉 - 如果可能

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

类型: 布尔值

默认值: 0

动态修剪 datetime64 值的尾随零,以将输出缩放调整为 [0, 3, 6],对应于 'seconds'、'milliseconds' 和 'microseconds'

date_time_input_format

类型: DateTimeInputFormat

默认值: basic

允许选择日期和时间文本表示的解析器。

此设置不适用于 日期和时间函数

可能的值:

  • 'best_effort' — 启用扩展解析。

    ClickHouse 可以解析基本的 YYYY-MM-DD HH:MM:SS 格式以及所有 ISO 8601 日期和时间格式。例如,'2018-06-08T01:02:03.000Z'

  • 'basic' — 使用基本解析器。

    ClickHouse 只能解析基本的 YYYY-MM-DD HH:MM:SSYYYY-MM-DD 格式。例如,2019-08-20 10:18:562019-08-20

云默认值: 'best_effort'

另请参见:

date_time_output_format

类型: DateTimeOutputFormat

默认值: simple

允许选择日期和时间文本表示的不同输出格式。

可能的值:

  • simple - 简单输出格式。

    ClickHouse 输出日期和时间为 YYYY-MM-DD hh:mm:ss 格式。例如,2019-08-20 10:18:56。根据数据类型的时区(如果存在)或服务器时区进行计算。

  • iso - ISO 输出格式。

    ClickHouse 输出日期和时间为 ISO 8601YYYY-MM-DDThh:mm:ssZ 格式。例如,2019-08-20T10:18:56Z。注意,输出为 UTC(Z 表示 UTC)。

  • unix_timestamp - Unix 时间戳输出格式。

    ClickHouse 输出日期和时间为 Unix 时间戳 格式。例如,1566285536

另请参见:

date_time_overflow_behavior

类型: DateTimeOverflowBehavior

默认值: ignore

定义在将 DateDate32DateTimeDateTime64 或整数转换为 Date、Date32、DateTime 或 DateTime64 时,值无法在结果类型中表示时的行为。

可能的值:

  • ignore — 默默忽略溢出。结果未定义。
  • throw — 在溢出时抛出异常。
  • saturate — 饱和结果。如果值小于目标类型可以表示的最小值,则结果选择为最小可表示值。如果值大于目标类型可以表示的最大值,则结果选择为最大可表示值。

默认值: ignore

dictionary_use_async_executor

类型: 布尔值

默认值: 0

在多个线程中执行读取字典源的管道。仅支持具有本地 CLICKHOUSE 源的字典。

errors_output_format

类型: 字符串

默认值: CSV

以文本输出写入错误的方法。

exact_rows_before_limit

类型: 布尔值

默认值: 0

启用时,ClickHouse 将为 rows_before_limit_at_least 统计提供确切值,但代价是必须完全读取限制之前的数据。

format_avro_schema_registry_url

类型: URI

默认值:

对于 AvroConfluent 格式:Confluent Schema Registry URL。

format_binary_max_array_size

类型: UInt64

默认值: 1073741824

RowBinary 格式中 Array 的最大允许大小。防止因数据损坏而分配大量内存。0 表示没有限制。

format_binary_max_string_size

类型: UInt64

默认值: 1073741824

RowBinary 格式中 String 的最大允许大小。防止因数据损坏而分配大量内存。0 表示没有限制。

format_capn_proto_enum_comparising_mode

类型: CapnProtoEnumComparingMode

默认值: by_values

如何映射 ClickHouse Enum 和 CapnProto Enum。

format_capn_proto_use_autogenerated_schema

类型: 布尔值

默认值: 1

当未设置 format_schema 时,使用自动生成的 CapnProto 模式。

format_csv_allow_double_quotes

类型: 布尔值

默认值: 1

如果设置为 true,允许使用双引号的字符串。

format_csv_allow_single_quotes

类型: 布尔值

默认值: 0

如果设置为 true,允许使用单引号的字符串。

format_csv_delimiter

类型: 字符

默认值: ,

在 CSV 数据中被视为分隔符的字符。如果设置为字符串,则字符串长度必须为 1。

format_csv_null_representation

类型: 字符串

默认值: \N

CSV 格式中的自定义 NULL 表示。

format_custom_escaping_rule

类型: EscapingRule

默认值: Escaped

字段转义规则(适用于 CustomSeparated 格式)。

format_custom_field_delimiter

类型: 字符串

默认值:

字段之间的分隔符(适用于 CustomSeparated 格式)。

format_custom_result_after_delimiter

类型: 字符串

默认值:

结果集之后的后缀(适用于 CustomSeparated 格式)。

format_custom_result_before_delimiter

类型: 字符串

默认值:

结果集之前的前缀(适用于 CustomSeparated 格式)。

format_custom_row_after_delimiter

类型: 字符串

默认值:

最后一列字段之后的分隔符(适用于 CustomSeparated 格式)。

format_custom_row_before_delimiter

类型: 字符串

默认值:

第一列字段之前的分隔符(适用于 CustomSeparated 格式)。

format_custom_row_between_delimiter

类型: 字符串

默认值:

行之间的分隔符(适用于 CustomSeparated 格式)。

format_display_secrets_in_show_and_select

类型: 布尔值

默认值: 0

启用或禁用在 SHOWSELECT 查询中显示表、数据库、表函数和字典的机密。

希望查看机密的用户还必须将 display_secrets_in_show_and_select 服务器设置 打开,并且具有 displaySecretsInShowAndSelect 权限。

可能的值:

  • 0 — 禁用。
  • 1 — 启用。

format_json_object_each_row_column_for_object_name

类型: 字符串

默认值:

将用于存储/写入对象名称的列名,格式为 JSONObjectEachRow。 列类型应为字符串。如果值为空,将使用默认名称 row_{i} 作为对象名称。

input_format_json_compact_allow_variable_number_of_columns

允许在 JSONCompact/JSONCompactEachRow 输入格式的行中有可变数量的列。 忽略超过预期列数的行中的额外列,并将缺失的列视为默认值。

默认情况下禁用。

output_format_markdown_escape_special_characters

启用时,转义 Markdown 中的特殊字符。

Common Mark 定义了以下可以使用 \ 转义的特殊字符:

可能的值:

  • 0 — 禁用。
  • 1 — 启用。

input_format_json_empty_as_default

启用时,在 JSON 中将空输入字段替换为默认值。对于复杂的默认表达式,input_format_defaults_for_omitted_fields 也必须启用。

可能的值:

  • 0 — 禁用。
  • 1 — 启用。

format_protobuf_use_autogenerated_schema

类型: 布尔值

默认值: 1

当未设置 format_schema 时,使用自动生成的 Protobuf。

format_regexp

类型: 字符串

默认值:

正则表达式(适用于 Regexp 格式)。

format_regexp_escaping_rule

类型: EscapingRule

默认值: Raw

字段转义规则(适用于 Regexp 格式)。

format_regexp_skip_unmatched

类型: 布尔值

默认值: 0

跳过正则表达式未匹配的行(适用于 Regexp 格式)。

format_schema

类型: 字符串

默认值:

当您使用需要架构定义的格式(例如 Cap'n ProtoProtobuf)时,此参数很有用。值依赖于格式。

format_template_resultset

类型: 字符串

默认值:

包含结果集格式字符串的文件路径(适用于 Template 格式)。

format_template_resultset_format

类型: 字符串

默认值:

结果集格式字符串(适用于 Template 格式)。

format_template_row

类型: 字符串

默认值:

包含行格式字符串的文件路径(适用于 Template 格式)。

format_template_row_format

类型: 字符串

默认值:

行格式字符串(适用于 Template 格式)。

format_template_rows_between_delimiter

类型: 字符串

默认值:

行之间的分隔符(适用于 Template 格式)。

format_tsv_null_representation

类型: 字符串

默认值: \N

TSV 格式中的自定义 NULL 表示。

input_format_allow_errors_num

类型: UInt64

默认值: 0

设置从文本格式(CSV、TSV 等)读取时允许的最大错误数量。

默认值为 0。

始终与 input_format_allow_errors_ratio 配对使用。

如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_num,ClickHouse 将忽略该行并继续处理下一行。

如果同时超过 input_format_allow_errors_numinput_format_allow_errors_ratio,ClickHouse 将抛出异常。

input_format_allow_errors_ratio

类型: Float

默认值: 0

设置从文本格式(CSV、TSV 等)读取时允许的最大错误百分比。 错误的百分比作为介于 0 和 1 之间的浮点数设置。

默认值为 0。

始终与 input_format_allow_errors_num 配对使用。

如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_ratio,ClickHouse 将忽略该行并继续处理下一行。

如果同时超过 input_format_allow_errors_numinput_format_allow_errors_ratio,ClickHouse 将抛出异常。

input_format_allow_seeks

类型: 布尔值

默认值: 1

允许在 ORC/Parquet/Arrow 输入格式上进行查找。

默认情况下启用。

input_format_arrow_allow_missing_columns

类型: 布尔值

默认值: 1

允许在读取 Arrow 输入格式时缺少列。

input_format_arrow_case_insensitive_column_matching

类型: 布尔值

默认值: 0

匹配 Arrow 列与 CH 列时忽略大小写。

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

类型: 布尔值

默认值: 0

在对格式 Arrow 进行模式推断时,跳过具有不支持类型的列。

input_format_avro_allow_missing_fields

类型: 布尔值

默认值: 0

对于 Avro/AvroConfluent 格式:在架构中找不到字段时,使用默认值而不是错误。

input_format_avro_null_as_default

类型: 布尔值

默认值: 0

对于 Avro/AvroConfluent 格式:在 null 和非 Nullable 列的情况下插入默认值。

input_format_binary_decode_types_in_binary_format

类型: 布尔值

默认值: 0

在 RowBinaryWithNamesAndTypes 输入格式中以二进制格式读取数据类型,而不是类型名称。

input_format_binary_read_json_as_string

类型: 布尔值

默认值: 0

在 RowBinary 输入格式中将 JSON 数据类型的值读取为 JSON String 值。

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

类型: 布尔值

默认值: 0

在对格式 BSON 进行模式推断时,跳过具有不支持类型的字段。

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

类型: 布尔值

默认值: 0

在对格式 CapnProto 进行模式推断时,跳过具有不支持类型的列。

input_format_csv_allow_cr_end_of_line

类型: 布尔值

默认值: 0

如果设置为 true,则允许 \r 在行末不跟随 \n。

input_format_csv_allow_variable_number_of_columns

类型: 布尔值

默认值: 0

在 CSV 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。

input_format_csv_allow_whitespace_or_tab_as_delimiter

类型: 布尔值

默认值: 0

允许在 CSV 字符串中使用空格和制表符(\t)作为字段分隔符。

input_format_csv_arrays_as_nested_csv

类型: 布尔值

默认值: 0

在从 CSV 读取 Array 时,期待其元素以嵌套 CSV 的方式序列化,然后放入字符串中。例如:"[""Hello"", ""world"", ""42"""" TV""]"。可以省略数组周围的括号。

input_format_csv_deserialize_separate_columns_into_tuple

类型: 布尔值

默认值: 1

如果设置为 true,则可以将以 CSV 格式编写的分离列反序列化为 Tuple 列。

input_format_csv_detect_header

类型: 布尔值

默认值: 1

自动检测 CSV 格式中的列名和类型的头部。

input_format_csv_empty_as_default

类型: 布尔值

默认值: 1

将 CSV 输入中的空字段视为默认值。

input_format_csv_enum_as_number

类型: 布尔值

默认值: 0

将 CSV 格式中插入的枚举值视为枚举索引。

input_format_csv_skip_first_lines

类型: UInt64

默认值: 0

跳过 CSV 格式数据开头的指定行数。

input_format_csv_skip_trailing_empty_lines

类型: 布尔值

默认值: 0

跳过 CSV 格式中的尾随空行。

input_format_csv_trim_whitespaces

类型: 布尔值

默认值: 1

修剪 CSV 字符串开头和结尾的空格和制表符(\t)字符。

input_format_csv_try_infer_numbers_from_strings

类型: 布尔值

默认值: 0

如果启用,在进行模式推断时,ClickHouse 将尝试从字符串字段推断数字。 如果 CSV 数据包含带引号的 UInt64 数字,这可能会很有用。

默认情况下禁用。

input_format_csv_try_infer_strings_from_quoted_tuples

类型: 布尔值

默认值: 1

将输入数据中的带引号元组解释为字符串类型的值。

input_format_csv_use_best_effort_in_schema_inference

类型: 布尔值

默认值: 1

在 CSV 格式中使用某些技巧和启发式来推断模式。

input_format_csv_use_default_on_bad_values

类型: 布尔值

默认值: 0

在 CSV 字段反序列化过程中,允许在错误值上设置列的默认值。

input_format_custom_allow_variable_number_of_columns

类型: 布尔值

默认值: 0

在 CustomSeparated 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。

input_format_custom_detect_header

类型: 布尔值

默认值: 1

自动检测 CustomSeparated 格式中的列名和类型的头部。

input_format_custom_skip_trailing_empty_lines

类型: 布尔值

默认值: 0

在 CustomSeparated 格式中跳过尾随空行。

input_format_defaults_for_omitted_fields

类型: 布尔值

默认值: 1

在执行 INSERT 查询时,用相应列的默认值替换省略的输入列值。此选项适用于 JSONEachRow(和其他 JSON 格式)、CSVTabSeparatedTSKVParquetArrowAvroORCNative 格式以及带有 WithNames/WithNamesAndTypes 后缀的格式。

备注

启用此选项时,扩展表元数据会从服务器发送到客户端。这会消耗服务器上的额外计算资源,并可能降低性能。

可能的值:

  • 0 — 禁用。
  • 1 — 启用。

input_format_force_null_for_omitted_fields

类型: 布尔值

默认值: 0

强制用 null 值初始化省略的字段。

input_format_hive_text_allow_variable_number_of_columns

类型: 布尔值

默认值: 1

在 Hive Text 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。

input_format_hive_text_collection_items_delimiter

类型: 字符

默认值: 

Hive 文本文件中集合(数组或映射)项之间的分隔符。

input_format_hive_text_fields_delimiter

类型: 字符

默认值: 

Hive 文本文件中字段之间的分隔符。

input_format_hive_text_map_keys_delimiter

类型: 字符

默认值: 

Hive 文本文件中键/值对之间的分隔符。

input_format_import_nested_json

类型: 布尔值

默认值: 0

启用或禁用插入具有嵌套对象的 JSON 数据。

支持的格式:

可能的值:

  • 0 — 禁用。
  • 1 — 启用。

另请参见:

input_format_ipv4_default_on_conversion_error

类型: 布尔值

默认值: 0

IPv4 的反序列化将在转换错误时使用默认值,而不是抛出异常。

默认情况下禁用。

input_format_ipv6_default_on_conversion_error

类型: 布尔值

默认值: 0

IPv6 的反序列化将在转换错误时使用默认值,而不是抛出异常。

默认情况下禁用。

input_format_json_compact_allow_variable_number_of_columns

类型: 布尔值

默认值: 0

在 JSONCompact(EachRow) 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。

input_format_json_defaults_for_missing_elements_in_named_tuple

类型: 布尔值

默认值: 1

在解析命名元组时,为 JSON 对象中缺失的元素插入默认值。 仅当启用设置 input_format_json_named_tuples_as_objects 时,此设置有效。

默认情况下启用。

input_format_json_empty_as_default

类型: 布尔值

默认值: 0

将 JSON 输入中的空字段视为默认值。

input_format_json_ignore_unknown_keys_in_named_tuple

类型: 布尔值

默认值: 1

在命名元组的 JSON 对象中忽略未知键。

默认情况下启用。

input_format_json_ignore_unnecessary_fields

类型: 布尔值

默认值: 1

忽略不必要的字段并不进行解析。启用此选项可能不会在 JSON 字符串格式错误或具有重复字段时抛出异常。

input_format_json_infer_incomplete_types_as_strings

类型: 布尔值

默认值: 1

在模式推断期间,允许对只包含 Null/{}/[] 的键使用字符串类型。 在 JSON 格式中,任何值都可以作为字符串读取,我们可以避免在模式推断期间出现类似 无法通过前 25000 行数据确定列的类型,该列可能只包含 Null 或空 Arrays/Maps 的错误。

示例:

结果:

默认情况下启用。

input_format_json_max_depth

类型: UInt64

默认值: 1000

JSON 字段的最大深度。这不是严格限制,不必精准应用。

input_format_json_named_tuples_as_objects

类型: 布尔值

默认值: 1

将命名元组列解析为 JSON 对象。

默认情况下启用。

input_format_json_read_arrays_as_strings

类型: 布尔值

默认值: 1

允许在 JSON 输入格式中将 JSON 数组解析为字符串。

示例:

结果:

默认情况下启用。

input_format_json_read_bools_as_numbers

类型: 布尔值

默认值: 1

允许在 JSON 输入格式中将布尔值解析为数字。

默认情况下启用。

input_format_json_read_bools_as_strings

类型: 布尔值

默认值: 1

允许在 JSON 输入格式中将布尔值解析为字符串。

默认情况下启用。

input_format_json_read_numbers_as_strings

类型: 布尔值

默认值: 1

允许在 JSON 输入格式中将数字解析为字符串。

默认情况下启用。

input_format_json_read_objects_as_strings

类型: 布尔值

默认值: 1

允许在 JSON 输入格式中将 JSON 对象解析为字符串。

示例:

结果:

默认情况下启用。

input_format_json_throw_on_bad_escape_sequence

类型: 布尔值

默认值: 1

如果 JSON 字符串包含 JSON 输入格式中的错误转义序列,则抛出异常。如果禁用,错误转义序列将在数据中保持不变。

默认情况下启用。

input_format_json_try_infer_named_tuples_from_objects

类型: 布尔值

默认值: 1

如果启用,ClickHouse 在模式推断期间将尝试从 JSON 对象推断命名元组。 结果命名元组将包含来自示例数据的所有对应 JSON 对象中的所有元素。

示例:

结果:

默认情况下启用。

input_format_json_try_infer_numbers_from_strings

类型: 布尔值

默认值: 0

如果启用,在进行模式推断时,ClickHouse 将尝试从字符串字段推断数字。 如果 JSON 数据包含带引号的 UInt64 数字,这可能会很有用。

默认情况下禁用。

input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects

类型: 布尔值

默认值: 0

在对 JSON 对象进行命名元组推断时,对于模糊路径使用字符串类型,而不是引发异常。

结果:

禁用设置的查询示例

查询:

结果:

output_format_json_escape_forward_slashes

类型: Bool

默认值: 1

控制在 JSON 输出格式中转义字符串输出中的正斜杠。这是为兼容性与 JavaScript 而设。不要与那些始终被转义的反斜杠混淆。

默认启用。

output_format_json_named_tuples_as_objects

类型: Bool

默认值: 1

将命名元组列序列化为 JSON 对象。

默认启用。

output_format_json_pretty_print

类型: Bool

默认值: 1

启用时,复杂数据类型(如元组/数组/映射)在 JSON 输出格式的 'data' 部分将以美观格式打印。

默认启用。

output_format_json_quote_64bit_floats

类型: Bool

默认值: 0

控制在 JSON* 格式输出时对 64 位 浮点数 的引号。

默认禁用。

output_format_json_quote_64bit_integers

类型: Bool

默认值: 1

控制在 JSON 格式中输出时对 64 位或更大 整数(如 UInt64Int128)的引号。此类整数默认用引号括起来。这种行为与大多数 JavaScript 实现兼容。

可能的值:

  • 0 - 整数不带引号输出。
  • 1 - 整数带引号输出。

output_format_json_quote_decimals

类型: Bool

默认值: 0

控制在 JSON 输出格式中对 decimal 的引号。

默认禁用。

output_format_json_quote_denormals

类型: Bool

默认值: 0

启用 [JSON](/interfaces/formats/JSON) 输出格式中的 +nan-nan+inf-inf 输出。

可能的值:

  • 0 - 禁用。
  • 1 - 启用。

示例

考虑以下表 account_orders

output_format_json_quote_denormals = 0 时,查询返回的输出中的 null 值:

output_format_json_quote_denormals = 1 时,查询返回:

output_format_json_skip_null_value_in_named_tuples

类型: Bool

默认值: 0

在序列化命名元组列为 JSON 对象时跳过带 null 值的键值对。仅在 output_format_json_named_tuples_as_objects 为 true 时有效。

output_format_json_validate_utf8

类型: Bool

默认值: 0

控制在 JSON 输出格式中验证 UTF-8 序列,不影响格式 JSON/JSONCompact/JSONColumnsWithMetadata,它们始终验证 UTF-8。

默认禁用。

output_format_markdown_escape_special_characters

类型: Bool

默认值: 0

转义 Markdown 中的特殊字符。

output_format_msgpack_uuid_representation

类型: MsgPackUUIDRepresentation

默认值: ext

在 MsgPack 格式中输出 UUID 的方式。

output_format_native_encode_types_in_binary_format

类型: Bool

默认值: 0

在原生输出格式中以二进制格式编写数据类型,而不是类型名称。

output_format_native_write_json_as_string

类型: Bool

默认值: 0

在 RowBinary 输出格式中,将 JSON 列的数据作为包含 JSON 字符串的 String 列写入,而不是默认的原生 JSON 序列化。

output_format_orc_compression_method

类型: ORCCompression

默认值: zstd

ORC 输出格式的压缩方式。支持的编解码器:lz4,snappy,zlib,zstd,none(未压缩)。

output_format_orc_dictionary_key_size_threshold

类型: Double

默认值: 0

对于 ORC 输出格式中的字符串列,如果不同值的数量大于非空行的总数的此比例,则关闭字典编码。否则启用字典编码。

output_format_orc_row_index_stride

类型: UInt64

默认值: 10000

ORC 输出格式中的目标行索引步幅。

output_format_orc_string_as_string

类型: Bool

默认值: 1

对 String 列使用 ORC String 类型而不是 Binary。

output_format_orc_writer_time_zone_name

类型: String

默认值: GMT

ORC 写入器的时区名称,默认的 ORC 写入器时区为 GMT。

output_format_parquet_batch_size

类型: UInt64

默认值: 1024

每多少行检查一次页面大小。如果您有平均值大小超过几 KB 的列,请考虑减少此值。

output_format_parquet_bloom_filter_bits_per_value

类型: Double

默认值: 10.5

在 parquet 布隆过滤器中每个不同值的近似位数。估计假阳性率:

  • 6 bits - 10%
  • 10.5 bits - 1%
  • 16.9 bits - 0.1%
  • 26.4 bits - 0.01%
  • 41 bits - 0.001%

output_format_parquet_bloom_filter_flush_threshold_bytes

类型: UInt64

默认值: 134217728

在 parquet 文件中放置布隆过滤器的位置。布隆过滤器将按大约这个大小分组写入。具体而言:

  • 如果 0,布隆过滤器将在行组后立即写入,
  • 如果大于所有布隆过滤器的总大小,所有行组的布隆过滤器将被在内存中累积,然后一起写入到文件的末尾,
  • 否则,布隆过滤器将在内存中累积,并在其总大小超过此值时写出。

output_format_parquet_compliant_nested_types

类型: Bool

默认值: 1

在 parquet 文件模式中,使用名称 'element' 而不是 'item' 表示列表元素。这是 Arrow 库实现的历史遗留物。通常增加兼容性,除非与一些旧版本的 Arrow 兼容。

output_format_parquet_compression_method

类型: ParquetCompression

默认值: zstd

Parquet 输出格式的压缩方式。支持的编解码器:snappy,lz4,brotli,zstd,gzip,none(未压缩)。

output_format_parquet_data_page_size

类型: UInt64

默认值: 1048576

以字节为单位的目标页大小,压缩前。

output_format_parquet_datetime_as_uint32

类型: Bool

默认值: 0

将 DateTime 值作为原始 UNIX 时间戳(读取为 UInt32)写入,而不是转换为毫秒(读取为 DateTime64(3))。

output_format_parquet_fixed_string_as_fixed_byte_array

类型: Bool

默认值: 1

对 FixedString 列使用 Parquet FIXED_LENGTH_BYTE_ARRAY 类型而不是 Binary。

output_format_parquet_parallel_encoding

类型: Bool

默认值: 1

在多个线程中进行 Parquet 编码。需要 output_format_parquet_use_custom_encoder

output_format_parquet_row_group_size

类型: UInt64

默认值: 1000000

目标行组大小(以行计)。

结果:

类型: UInt64

默认值: 50

设置如果启用了 output_format_pretty_display_footer_column_names,则将显示列名的页脚的最小行数。

output_format_pretty_fallback_to_vertical

类型: Bool

默认值: 1

如果启用并且表格宽但短,Pretty 格式将像垂直格式那样输出。 有关此行为详细调优,请参见 output_format_pretty_fallback_to_vertical_max_rows_per_chunkoutput_format_pretty_fallback_to_vertical_min_table_width

output_format_pretty_fallback_to_vertical_max_rows_per_chunk

类型: UInt64

默认值: 10

只有当一个块中的记录数不超过指定值时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical)。

output_format_pretty_fallback_to_vertical_min_columns

类型: UInt64

默认值: 5

只有当列数大于指定值时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical)。

output_format_pretty_fallback_to_vertical_min_table_width

类型: UInt64

默认值: 250

只有当表中的列长度总和至少达到指定值,或至少有一个值包含换行符时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical)。

output_format_pretty_grid_charset

类型: String

默认值: UTF-8

用于打印网格边框的字符集。可用的字符集:ASCII、UTF-8(默认)。

output_format_pretty_highlight_digit_groups

类型: Bool

默认值: 1

如果启用且输出为终端,则每个对应于千位、百万位等的数字都将突出显示,带下划线。

output_format_pretty_highlight_trailing_spaces

类型: Bool

默认值: 1

如果启用且输出为终端,则用灰色和下划线突出显示尾随空格。

output_format_pretty_max_column_name_width_cut_to

类型: UInt64

默认值: 24

如果列名太长,则将其截断到该长度。 如果列名的长度超过 output_format_pretty_max_column_name_width_cut_tooutput_format_pretty_max_column_name_width_min_chars_to_cut,则列名将被截断。

output_format_pretty_max_column_name_width_min_chars_to_cut

类型: UInt64

默认值: 4

如果列名太长,最少要截断的字符数。 如果列名的长度超过 output_format_pretty_max_column_name_width_cut_tooutput_format_pretty_max_column_name_width_min_chars_to_cut,则列名将被截断。

output_format_pretty_max_column_pad_width

类型: UInt64

默认值: 250

在 Pretty 格式中填充列中所有值的最大宽度。

output_format_pretty_max_rows

类型: UInt64

默认值: 1000

Pretty 格式的行数限制。

output_format_pretty_max_value_width

类型: UInt64

默认值: 10000

在 Pretty 格式中显示的值的最大宽度。如果更大,值将被截断。 值 0 表示——永远不截断。

output_format_pretty_max_value_width_apply_for_single_value

类型: UInt64

默认值: 0

仅在块中不是单一值时截断值(参见 output_format_pretty_max_value_width 设置)。否则,完整输出,这对于 SHOW CREATE TABLE 查询非常有用。

output_format_pretty_multiline_fields

类型: Bool

默认值: 1

如果启用,Pretty 格式将在表格单元格内呈现多行字段,因此表格的大纲将被保留。 如果不这样做,它们将按原样呈现,可能会变形表格(关闭时的一个优点是,复制粘贴多行值会更容易)。

output_format_pretty_row_numbers

类型: Bool

默认值: 1

在每行前添加行号以进行漂亮的输出格式。

output_format_pretty_single_large_number_tip_threshold

类型: UInt64

默认值: 1000000

如果块由一个超出该值的单一数字组成(不包括 0),则在表的右侧打印可读的数字提示。

output_format_pretty_squash_consecutive_ms

类型: UInt64

默认值: 50

等待下一个块,最多指定毫秒数,并在写入之前将其压扁到前一个块。 这避免了输出过小的块,但仍然可以以流式方式显示数据。

output_format_pretty_squash_max_wait_ms

类型: UInt64

默认值: 1000

如果自上一个输出以来经过的时间超过指定的毫秒数,则在 Pretty 格式中输出待定块。

output_format_protobuf_nullables_with_google_wrappers

类型: Bool

默认值: 0

序列化带 Google 包装器的 Nullable 列时,将默认值序列化为空包装器。如果关闭,默认值和空值将不会被序列化。

output_format_schema

类型: String

默认值:

自动生成的模式将保存到 Cap'n ProtoProtobuf 格式的文件路径。

output_format_sql_insert_include_column_names

类型: Bool

默认值: 1

在 INSERT 查询中包含列名。

output_format_sql_insert_max_batch_size

类型: UInt64

默认值: 65409

一个 INSERT 语句中的最大行数。

output_format_sql_insert_quote_names

类型: Bool

默认值: 1

用 '`' 字符引用列名。

output_format_sql_insert_table_name

类型: String

默认值: table

输出 INSERT 查询中的表名。

output_format_sql_insert_use_replace

类型: Bool

默认值: 0

使用 REPLACE 语句而不是 INSERT。

output_format_tsv_crlf_end_of_line

类型: Bool

默认值: 0

如果设置为 true,TSV 格式中的行尾将为 \r\n,而不是 \n。

output_format_values_escape_quote_with_quote

类型: Bool

默认值: 0

如果为 true,则使用 '' 转义 ',否则使用 \' 引号。

output_format_write_statistics

类型: Bool

默认值: 1

输出格式中写入关于读取的行、字节、耗时的统计信息。

默认启用。

precise_float_parsing

类型: Bool

默认值: 0

优先使用更精确(但较慢)的浮点解析算法。

regexp_dict_allow_hyperscan

类型: Bool

默认值: 1

允许 regexp_tree 字典使用 Hyperscan 库。

regexp_dict_flag_case_insensitive

类型: Bool

默认值: 0

对于 regexp_tree 字典使用不区分大小写的匹配。可以在单个表达式中使用 (?i) 和 (?-i) 覆盖。

regexp_dict_flag_dotall

类型: Bool

默认值: 0

允许 '.' 匹配换行符以用于 regexp_tree 字典。

rows_before_aggregation

类型: Bool

默认值: 0

启用时,ClickHouse 将提供行聚合前读取的确切行数的统计信息。

schema_inference_hints

类型: String

默认值:

用于未指定模式格式的模式推断的提示列名和类型列表。

示例:

查询:

结果:

备注

如果 schema_inference_hints 格式不正确,或者存在拼写错误或数据类型错误等... 则整个 schema_inference_hints 将被忽略。

schema_inference_make_columns_nullable

类型: UInt64Auto

默认值: 1

控制在模式推断中推断类型是否为 Nullable。 如果启用,所有推断类型将为 Nullable;如果禁用,推断类型将永远不是 Nullable;如果设置为 auto,则仅在解析的样本中包含 NULL 或文件元数据包含关于列可空性的信息时,推断类型将为 Nullable

schema_inference_make_json_columns_nullable

类型: Bool

默认值: 0

控制在模式推断中推断的 JSON 类型是否为 Nullable。 如果在启用了 schema_inference_make_columns_nullable 设置时该设置也启用,则推断的 JSON 类型将为 Nullable

schema_inference_mode

类型: SchemaInferenceMode

默认值: default

模式推断的模式。‘default’ - 假设所有文件具有相同的模式,且可以从任何文件推断模式,‘union’ - 文件可以具有不同的模式,结果模式应为所有文件模式的联合。

show_create_query_identifier_quoting_rule

类型: IdentifierQuotingRule

默认值: when_necessary

在 SHOW CREATE 查询中设置标识符的引用规则。

show_create_query_identifier_quoting_style

类型: IdentifierQuotingStyle

默认值: Backticks

在 SHOW CREATE 查询中设置标识符的引用样式。

type_json_skip_duplicated_paths

类型: Bool

默认值: 0

启用时,在将 JSON 对象解析为 JSON 类型时,将忽略重复的路径,仅插入第一个路径,而不是引发异常。

validate_experimental_and_suspicious_types_inside_nested_types

类型: Bool

默认值: 1

验证嵌套类型(如 Array/Map/Tuple)中实验性和可疑类型的使用。