格式设置
这些设置是从 source 自动生成的。
bool_false_representation
类型: 字符串
默认值: false
用于表示 TSV/CSV/Vertical/Pretty 格式中的 false 布尔值的文本。
bool_true_representation
类型: 字符串
默认值: true
用于表示 TSV/CSV/Vertical/Pretty 格式中的 true 布尔值的文本。
column_names_for_schema_inference
类型: 字符串
默认值:
用于无列名称格式的模式推断的列名列表。格式: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
类型: UInt64
默认值: 1
如果 WHERE 部分有连接表达式,则使用内连接代替逗号/交叉连接。值: 0 - 不重写,1 - 如果可能应用于逗号/交叉连接,2 - 强制重写所有逗号连接,交叉 - 如果可能
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
类型: 布尔值
默认值: 0
动态修剪 datetime64 值的尾随零,以将输出缩放调整为 [0, 3, 6],对应于 'seconds'、'milliseconds' 和 'microseconds'
date_time_input_format
类型: DateTimeInputFormat
默认值: basic
允许选择日期和时间文本表示的解析器。
此设置不适用于 日期和时间函数。
可能的值:
-
'best_effort'
— 启用扩展解析。ClickHouse 可以解析基本的
YYYY-MM-DD HH:MM:SS
格式以及所有 ISO 8601 日期和时间格式。例如,'2018-06-08T01:02:03.000Z'
。 -
'basic'
— 使用基本解析器。ClickHouse 只能解析基本的
YYYY-MM-DD HH:MM:SS
或YYYY-MM-DD
格式。例如,2019-08-20 10:18:56
或2019-08-20
。
云默认值: 'best_effort'
。
另请参见:
date_time_output_format
类型: DateTimeOutputFormat
默认值: simple
允许选择日期和时间文本表示的不同输出格式。
可能的值:
-
simple
- 简单输出格式。ClickHouse 输出日期和时间为
YYYY-MM-DD hh:mm:ss
格式。例如,2019-08-20 10:18:56
。根据数据类型的时区(如果存在)或服务器时区进行计算。 -
iso
- ISO 输出格式。ClickHouse 输出日期和时间为 ISO 8601 的
YYYY-MM-DDThh:mm:ssZ
格式。例如,2019-08-20T10:18:56Z
。注意,输出为 UTC(Z
表示 UTC)。 -
unix_timestamp
- Unix 时间戳输出格式。ClickHouse 输出日期和时间为 Unix 时间戳 格式。例如,
1566285536
。
另请参见:
date_time_overflow_behavior
类型: DateTimeOverflowBehavior
默认值: ignore
定义在将 Date、Date32、DateTime、DateTime64 或整数转换为 Date、Date32、DateTime 或 DateTime64 时,值无法在结果类型中表示时的行为。
可能的值:
ignore
— 默默忽略溢出。结果未定义。throw
— 在溢出时抛出异常。saturate
— 饱和结果。如果值小于目标类型可以表示的最小值,则结果选择为最小可表示值。如果值大于目标类型可以表示的最大值,则结果选择为最大可表示值。
默认值: ignore
。
dictionary_use_async_executor
类型: 布尔值
默认值: 0
在多个线程中执行读取字典源的管道。仅支持具有本地 CLICKHOUSE 源的字典。
errors_output_format
类型: 字符串
默认值: CSV
以文本输出写入错误的方法。
exact_rows_before_limit
类型: 布尔值
默认值: 0
启用时,ClickHouse 将为 rows_before_limit_at_least 统计提供确切值,但代价是必须完全读取限制之前的数据。
format_avro_schema_registry_url
类型: URI
默认值:
对于 AvroConfluent 格式:Confluent Schema Registry URL。
format_binary_max_array_size
类型: UInt64
默认值: 1073741824
RowBinary 格式中 Array 的最大允许大小。防止因数据损坏而分配大量内存。0 表示没有限制。
format_binary_max_string_size
类型: UInt64
默认值: 1073741824
RowBinary 格式中 String 的最大允许大小。防止因数据损坏而分配大量内存。0 表示没有限制。
format_capn_proto_enum_comparising_mode
类型: CapnProtoEnumComparingMode
默认值: by_values
如何映射 ClickHouse Enum 和 CapnProto Enum。
format_capn_proto_use_autogenerated_schema
类型: 布尔值
默认值: 1
当未设置 format_schema 时,使用自动生成的 CapnProto 模式。
format_csv_allow_double_quotes
类型: 布尔值
默认值: 1
如果设置为 true,允许使用双引号的字符串。
format_csv_allow_single_quotes
类型: 布尔值
默认值: 0
如果设置为 true,允许使用单引号的字符串。
format_csv_delimiter
类型: 字符
默认值: ,
在 CSV 数据中被视为分隔符的字符。如果设置为字符串,则字符串长度必须为 1。
format_csv_null_representation
类型: 字符串
默认值: \N
CSV 格式中的自定义 NULL 表示。
format_custom_escaping_rule
类型: EscapingRule
默认值: Escaped
字段转义规则(适用于 CustomSeparated 格式)。
format_custom_field_delimiter
类型: 字符串
默认值:
字段之间的分隔符(适用于 CustomSeparated 格式)。
format_custom_result_after_delimiter
类型: 字符串
默认值:
结果集之后的后缀(适用于 CustomSeparated 格式)。
format_custom_result_before_delimiter
类型: 字符串
默认值:
结果集之前的前缀(适用于 CustomSeparated 格式)。
format_custom_row_after_delimiter
类型: 字符串
默认值:
最后一列字段之后的分隔符(适用于 CustomSeparated 格式)。
format_custom_row_before_delimiter
类型: 字符串
默认值:
第一列字段之前的分隔符(适用于 CustomSeparated 格式)。
format_custom_row_between_delimiter
类型: 字符串
默认值:
行之间的分隔符(适用于 CustomSeparated 格式)。
format_display_secrets_in_show_and_select
类型: 布尔值
默认值: 0
启用或禁用在 SHOW
和 SELECT
查询中显示表、数据库、表函数和字典的机密。
希望查看机密的用户还必须将
display_secrets_in_show_and_select
服务器设置
打开,并且具有
displaySecretsInShowAndSelect
权限。
可能的值:
- 0 — 禁用。
- 1 — 启用。
format_json_object_each_row_column_for_object_name
类型: 字符串
默认值:
将用于存储/写入对象名称的列名,格式为 JSONObjectEachRow。
列类型应为字符串。如果值为空,将使用默认名称 row_{i}
作为对象名称。
input_format_json_compact_allow_variable_number_of_columns
允许在 JSONCompact/JSONCompactEachRow 输入格式的行中有可变数量的列。 忽略超过预期列数的行中的额外列,并将缺失的列视为默认值。
默认情况下禁用。
output_format_markdown_escape_special_characters
启用时,转义 Markdown 中的特殊字符。
Common Mark 定义了以下可以使用 \ 转义的特殊字符:
可能的值:
- 0 — 禁用。
- 1 — 启用。
input_format_json_empty_as_default
启用时,在 JSON 中将空输入字段替换为默认值。对于复杂的默认表达式,input_format_defaults_for_omitted_fields
也必须启用。
可能的值:
- 0 — 禁用。
- 1 — 启用。
format_protobuf_use_autogenerated_schema
类型: 布尔值
默认值: 1
当未设置 format_schema 时,使用自动生成的 Protobuf。
format_regexp
类型: 字符串
默认值:
正则表达式(适用于 Regexp 格式)。
format_regexp_escaping_rule
类型: EscapingRule
默认值: Raw
字段转义规则(适用于 Regexp 格式)。
format_regexp_skip_unmatched
类型: 布尔值
默认值: 0
跳过正则表达式未匹配的行(适用于 Regexp 格式)。
format_schema
类型: 字符串
默认值:
当您使用需要架构定义的格式(例如 Cap'n Proto 或 Protobuf)时,此参数很有用。值依赖于格式。
format_template_resultset
类型: 字符串
默认值:
包含结果集格式字符串的文件路径(适用于 Template 格式)。
format_template_resultset_format
类型: 字符串
默认值:
结果集格式字符串(适用于 Template 格式)。
format_template_row
类型: 字符串
默认值:
包含行格式字符串的文件路径(适用于 Template 格式)。
format_template_row_format
类型: 字符串
默认值:
行格式字符串(适用于 Template 格式)。
format_template_rows_between_delimiter
类型: 字符串
默认值:
行之间的分隔符(适用于 Template 格式)。
format_tsv_null_representation
类型: 字符串
默认值: \N
TSV 格式中的自定义 NULL 表示。
input_format_allow_errors_num
类型: UInt64
默认值: 0
设置从文本格式(CSV、TSV 等)读取时允许的最大错误数量。
默认值为 0。
始终与 input_format_allow_errors_ratio
配对使用。
如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_num
,ClickHouse 将忽略该行并继续处理下一行。
如果同时超过 input_format_allow_errors_num
和 input_format_allow_errors_ratio
,ClickHouse 将抛出异常。
input_format_allow_errors_ratio
类型: Float
默认值: 0
设置从文本格式(CSV、TSV 等)读取时允许的最大错误百分比。 错误的百分比作为介于 0 和 1 之间的浮点数设置。
默认值为 0。
始终与 input_format_allow_errors_num
配对使用。
如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_ratio
,ClickHouse 将忽略该行并继续处理下一行。
如果同时超过 input_format_allow_errors_num
和 input_format_allow_errors_ratio
,ClickHouse 将抛出异常。
input_format_allow_seeks
类型: 布尔值
默认值: 1
允许在 ORC/Parquet/Arrow 输入格式上进行查找。
默认情况下启用。
input_format_arrow_allow_missing_columns
类型: 布尔值
默认值: 1
允许在读取 Arrow 输入格式时缺少列。
input_format_arrow_case_insensitive_column_matching
类型: 布尔值
默认值: 0
匹配 Arrow 列与 CH 列时忽略大小写。
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在对格式 Arrow 进行模式推断时,跳过具有不支持类型的列。
input_format_avro_allow_missing_fields
类型: 布尔值
默认值: 0
对于 Avro/AvroConfluent 格式:在架构中找不到字段时,使用默认值而不是错误。
input_format_avro_null_as_default
类型: 布尔值
默认值: 0
对于 Avro/AvroConfluent 格式:在 null 和非 Nullable 列的情况下插入默认值。
input_format_binary_decode_types_in_binary_format
类型: 布尔值
默认值: 0
在 RowBinaryWithNamesAndTypes 输入格式中以二进制格式读取数据类型,而不是类型名称。
input_format_binary_read_json_as_string
类型: 布尔值
默认值: 0
在 RowBinary 输入格式中将 JSON 数据类型的值读取为 JSON String 值。
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在对格式 BSON 进行模式推断时,跳过具有不支持类型的字段。
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在对格式 CapnProto 进行模式推断时,跳过具有不支持类型的列。
input_format_csv_allow_cr_end_of_line
类型: 布尔值
默认值: 0
如果设置为 true,则允许 \r 在行末不跟随 \n。
input_format_csv_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
在 CSV 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。
input_format_csv_allow_whitespace_or_tab_as_delimiter
类型: 布尔值
默认值: 0
允许在 CSV 字符串中使用空格和制表符(\t)作为字段分隔符。
input_format_csv_arrays_as_nested_csv
类型: 布尔值
默认值: 0
在从 CSV 读取 Array 时,期待其元素以嵌套 CSV 的方式序列化,然后放入字符串中。例如:"[""Hello"", ""world"", ""42"""" TV""]"。可以省略数组周围的括号。
input_format_csv_deserialize_separate_columns_into_tuple
类型: 布尔值
默认值: 1
如果设置为 true,则可以将以 CSV 格式编写的分离列反序列化为 Tuple 列。
input_format_csv_detect_header
类型: 布尔值
默认值: 1
自动检测 CSV 格式中的列名和类型的头部。
input_format_csv_empty_as_default
类型: 布尔值
默认值: 1
将 CSV 输入中的空字段视为默认值。
input_format_csv_enum_as_number
类型: 布尔值
默认值: 0
将 CSV 格式中插入的枚举值视为枚举索引。
input_format_csv_skip_first_lines
类型: UInt64
默认值: 0
跳过 CSV 格式数据开头的指定行数。
input_format_csv_skip_trailing_empty_lines
类型: 布尔值
默认值: 0
跳过 CSV 格式中的尾随空行。
input_format_csv_trim_whitespaces
类型: 布尔值
默认值: 1
修剪 CSV 字符串开头和结尾的空格和制表符(\t)字符。
input_format_csv_try_infer_numbers_from_strings
类型: 布尔值
默认值: 0
如果启用,在进行模式推断时,ClickHouse 将尝试从字符串字段推断数字。 如果 CSV 数据包含带引号的 UInt64 数字,这可能会很有用。
默认情况下禁用。
input_format_csv_try_infer_strings_from_quoted_tuples
类型: 布尔值
默认值: 1
将输入数据中的带引号元组解释为字符串类型的值。
input_format_csv_use_best_effort_in_schema_inference
类型: 布尔值
默认值: 1
在 CSV 格式中使用某些技巧和启发式来推断模式。
input_format_csv_use_default_on_bad_values
类型: 布尔值
默认值: 0
在 CSV 字段反序列化过程中,允许在错误值上设置列的默认值。
input_format_custom_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
在 CustomSeparated 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。
input_format_custom_detect_header
类型: 布尔值
默认值: 1
自动检测 CustomSeparated 格式中的列名和类型的头部。
input_format_custom_skip_trailing_empty_lines
类型: 布尔值
默认值: 0
在 CustomSeparated 格式中跳过尾随空行。
input_format_defaults_for_omitted_fields
类型: 布尔值
默认值: 1
在执行 INSERT
查询时,用相应列的默认值替换省略的输入列值。此选项适用于 JSONEachRow(和其他 JSON 格式)、CSV、TabSeparated、TSKV、Parquet、Arrow、Avro、ORC、Native 格式以及带有 WithNames
/WithNamesAndTypes
后缀的格式。
启用此选项时,扩展表元数据会从服务器发送到客户端。这会消耗服务器上的额外计算资源,并可能降低性能。
可能的值:
- 0 — 禁用。
- 1 — 启用。
input_format_force_null_for_omitted_fields
类型: 布尔值
默认值: 0
强制用 null 值初始化省略的字段。
input_format_hive_text_allow_variable_number_of_columns
类型: 布尔值
默认值: 1
在 Hive Text 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。
input_format_hive_text_collection_items_delimiter
类型: 字符
默认值:
Hive 文本文件中集合(数组或映射)项之间的分隔符。
input_format_hive_text_fields_delimiter
类型: 字符
默认值:
Hive 文本文件中字段之间的分隔符。
input_format_hive_text_map_keys_delimiter
类型: 字符
默认值:
Hive 文本文件中键/值对之间的分隔符。
input_format_import_nested_json
类型: 布尔值
默认值: 0
启用或禁用插入具有嵌套对象的 JSON 数据。
支持的格式:
可能的值:
- 0 — 禁用。
- 1 — 启用。
另请参见:
- 嵌套结构的使用 使用
JSONEachRow
格式。
input_format_ipv4_default_on_conversion_error
类型: 布尔值
默认值: 0
IPv4 的反序列化将在转换错误时使用默认值,而不是抛出异常。
默认情况下禁用。
input_format_ipv6_default_on_conversion_error
类型: 布尔值
默认值: 0
IPv6 的反序列化将在转换错误时使用默认值,而不是抛出异常。
默认情况下禁用。
input_format_json_compact_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
在 JSONCompact(EachRow) 输入中忽略额外列(如果文件包含超过预期的列数),并将缺失的字段视为默认值。
input_format_json_defaults_for_missing_elements_in_named_tuple
类型: 布尔值
默认值: 1
在解析命名元组时,为 JSON 对象中缺失的元素插入默认值。
仅当启用设置 input_format_json_named_tuples_as_objects
时,此设置有效。
默认情况下启用。
input_format_json_empty_as_default
类型: 布尔值
默认值: 0
将 JSON 输入中的空字段视为默认值。
input_format_json_ignore_unknown_keys_in_named_tuple
类型: 布尔值
默认值: 1
在命名元组的 JSON 对象中忽略未知键。
默认情况下启用。
input_format_json_ignore_unnecessary_fields
类型: 布尔值
默认值: 1
忽略不必要的字段并不进行解析。启用此选项可能不会在 JSON 字符串格式错误或具有重复字段时抛出异常。
input_format_json_infer_incomplete_types_as_strings
类型: 布尔值
默认值: 1
在模式推断期间,允许对只包含 Null
/{}
/[]
的键使用字符串类型。
在 JSON 格式中,任何值都可以作为字符串读取,我们可以避免在模式推断期间出现类似 无法通过前 25000 行数据确定列的类型,该列可能只包含 Null 或空 Arrays/Maps
的错误。
示例:
结果:
默认情况下启用。
input_format_json_max_depth
类型: UInt64
默认值: 1000
JSON 字段的最大深度。这不是严格限制,不必精准应用。
input_format_json_named_tuples_as_objects
类型: 布尔值
默认值: 1
将命名元组列解析为 JSON 对象。
默认情况下启用。
input_format_json_read_arrays_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将 JSON 数组解析为字符串。
示例:
结果:
默认情况下启用。
input_format_json_read_bools_as_numbers
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将布尔值解析为数字。
默认情况下启用。
input_format_json_read_bools_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将布尔值解析为字符串。
默认情况下启用。
input_format_json_read_numbers_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将数字解析为字符串。
默认情况下启用。
input_format_json_read_objects_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将 JSON 对象解析为字符串。
示例:
结果:
默认情况下启用。
input_format_json_throw_on_bad_escape_sequence
类型: 布尔值
默认值: 1
如果 JSON 字符串包含 JSON 输入格式中的错误转义序列,则抛出异常。如果禁用,错误转义序列将在数据中保持不变。
默认情况下启用。
input_format_json_try_infer_named_tuples_from_objects
类型: 布尔值
默认值: 1
如果启用,ClickHouse 在模式推断期间将尝试从 JSON 对象推断命名元组。 结果命名元组将包含来自示例数据的所有对应 JSON 对象中的所有元素。
示例:
结果:
默认情况下启用。
input_format_json_try_infer_numbers_from_strings
类型: 布尔值
默认值: 0
如果启用,在进行模式推断时,ClickHouse 将尝试从字符串字段推断数字。 如果 JSON 数据包含带引号的 UInt64 数字,这可能会很有用。
默认情况下禁用。
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
类型: 布尔值
默认值: 0
在对 JSON 对象进行命名元组推断时,对于模糊路径使用字符串类型,而不是引发异常。
结果:
禁用设置的查询示例
查询:
结果:
output_format_json_escape_forward_slashes
类型: Bool
默认值: 1
控制在 JSON 输出格式中转义字符串输出中的正斜杠。这是为兼容性与 JavaScript 而设。不要与那些始终被转义的反斜杠混淆。
默认启用。
output_format_json_named_tuples_as_objects
类型: Bool
默认值: 1
将命名元组列序列化为 JSON 对象。
默认启用。
output_format_json_pretty_print
类型: Bool
默认值: 1
启用时,复杂数据类型(如元组/数组/映射)在 JSON 输出格式的 'data' 部分将以美观格式打印。
默认启用。
output_format_json_quote_64bit_floats
类型: Bool
默认值: 0
控制在 JSON* 格式输出时对 64 位 浮点数 的引号。
默认禁用。
output_format_json_quote_64bit_integers
类型: Bool
默认值: 1
控制在 JSON 格式中输出时对 64 位或更大 整数(如 UInt64
或 Int128
)的引号。此类整数默认用引号括起来。这种行为与大多数 JavaScript 实现兼容。
可能的值:
- 0 - 整数不带引号输出。
- 1 - 整数带引号输出。
output_format_json_quote_decimals
类型: Bool
默认值: 0
控制在 JSON 输出格式中对 decimal 的引号。
默认禁用。
output_format_json_quote_denormals
类型: Bool
默认值: 0
启用 [JSON](/interfaces/formats/JSON)
输出格式中的 +nan
、-nan
、+inf
、-inf
输出。
可能的值:
- 0 - 禁用。
- 1 - 启用。
示例
考虑以下表 account_orders
:
当 output_format_json_quote_denormals = 0
时,查询返回的输出中的 null
值:
当 output_format_json_quote_denormals = 1
时,查询返回:
output_format_json_skip_null_value_in_named_tuples
类型: Bool
默认值: 0
在序列化命名元组列为 JSON 对象时跳过带 null 值的键值对。仅在 output_format_json_named_tuples_as_objects
为 true 时有效。
output_format_json_validate_utf8
类型: Bool
默认值: 0
控制在 JSON 输出格式中验证 UTF-8 序列,不影响格式 JSON/JSONCompact/JSONColumnsWithMetadata,它们始终验证 UTF-8。
默认禁用。
output_format_markdown_escape_special_characters
类型: Bool
默认值: 0
转义 Markdown 中的特殊字符。
output_format_msgpack_uuid_representation
类型: MsgPackUUIDRepresentation
默认值: ext
在 MsgPack 格式中输出 UUID 的方式。
output_format_native_encode_types_in_binary_format
类型: Bool
默认值: 0
在原生输出格式中以二进制格式编写数据类型,而不是类型名称。
output_format_native_write_json_as_string
类型: Bool
默认值: 0
在 RowBinary 输出格式中,将 JSON 列的数据作为包含 JSON 字符串的 String 列写入,而不是默认的原生 JSON 序列化。
output_format_orc_compression_method
类型: ORCCompression
默认值: zstd
ORC 输出格式的压缩方式。支持的编解码器:lz4,snappy,zlib,zstd,none(未压缩)。
output_format_orc_dictionary_key_size_threshold
类型: Double
默认值: 0
对于 ORC 输出格式中的字符串列,如果不同值的数量大于非空行的总数的此比例,则关闭字典编码。否则启用字典编码。
output_format_orc_row_index_stride
类型: UInt64
默认值: 10000
ORC 输出格式中的目标行索引步幅。
output_format_orc_string_as_string
类型: Bool
默认值: 1
对 String 列使用 ORC String 类型而不是 Binary。
output_format_orc_writer_time_zone_name
类型: String
默认值: GMT
ORC 写入器的时区名称,默认的 ORC 写入器时区为 GMT。
output_format_parquet_batch_size
类型: UInt64
默认值: 1024
每多少行检查一次页面大小。如果您有平均值大小超过几 KB 的列,请考虑减少此值。
output_format_parquet_bloom_filter_bits_per_value
类型: Double
默认值: 10.5
在 parquet 布隆过滤器中每个不同值的近似位数。估计假阳性率:
- 6 bits - 10%
- 10.5 bits - 1%
- 16.9 bits - 0.1%
- 26.4 bits - 0.01%
- 41 bits - 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
类型: UInt64
默认值: 134217728
在 parquet 文件中放置布隆过滤器的位置。布隆过滤器将按大约这个大小分组写入。具体而言:
- 如果 0,布隆过滤器将在行组后立即写入,
- 如果大于所有布隆过滤器的总大小,所有行组的布隆过滤器将被在内存中累积,然后一起写入到文件的末尾,
- 否则,布隆过滤器将在内存中累积,并在其总大小超过此值时写出。
output_format_parquet_compliant_nested_types
类型: Bool
默认值: 1
在 parquet 文件模式中,使用名称 'element' 而不是 'item' 表示列表元素。这是 Arrow 库实现的历史遗留物。通常增加兼容性,除非与一些旧版本的 Arrow 兼容。
output_format_parquet_compression_method
类型: ParquetCompression
默认值: zstd
Parquet 输出格式的压缩方式。支持的编解码器:snappy,lz4,brotli,zstd,gzip,none(未压缩)。
output_format_parquet_data_page_size
类型: UInt64
默认值: 1048576
以字节为单位的目标页大小,压缩前。
output_format_parquet_datetime_as_uint32
类型: Bool
默认值: 0
将 DateTime 值作为原始 UNIX 时间戳(读取为 UInt32)写入,而不是转换为毫秒(读取为 DateTime64(3))。
output_format_parquet_fixed_string_as_fixed_byte_array
类型: Bool
默认值: 1
对 FixedString 列使用 Parquet FIXED_LENGTH_BYTE_ARRAY 类型而不是 Binary。
output_format_parquet_parallel_encoding
类型: Bool
默认值: 1
在多个线程中进行 Parquet 编码。需要 output_format_parquet_use_custom_encoder
。
output_format_parquet_row_group_size
类型: UInt64
默认值: 1000000
目标行组大小(以行计)。
结果:
output_format_pretty_display_footer_column_names_min_rows
类型: UInt64
默认值: 50
设置如果启用了 output_format_pretty_display_footer_column_names,则将显示列名的页脚的最小行数。
output_format_pretty_fallback_to_vertical
类型: Bool
默认值: 1
如果启用并且表格宽但短,Pretty 格式将像垂直格式那样输出。
有关此行为详细调优,请参见 output_format_pretty_fallback_to_vertical_max_rows_per_chunk
和 output_format_pretty_fallback_to_vertical_min_table_width
。
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
类型: UInt64
默认值: 10
只有当一个块中的记录数不超过指定值时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical
)。
output_format_pretty_fallback_to_vertical_min_columns
类型: UInt64
默认值: 5
只有当列数大于指定值时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical
)。
output_format_pretty_fallback_to_vertical_min_table_width
类型: UInt64
默认值: 250
只有当表中的列长度总和至少达到指定值,或至少有一个值包含换行符时,才会激活回退到垂直格式(参见 output_format_pretty_fallback_to_vertical
)。
output_format_pretty_grid_charset
类型: String
默认值: UTF-8
用于打印网格边框的字符集。可用的字符集:ASCII、UTF-8(默认)。
output_format_pretty_highlight_digit_groups
类型: Bool
默认值: 1
如果启用且输出为终端,则每个对应于千位、百万位等的数字都将突出显示,带下划线。
output_format_pretty_highlight_trailing_spaces
类型: Bool
默认值: 1
如果启用且输出为终端,则用灰色和下划线突出显示尾随空格。
output_format_pretty_max_column_name_width_cut_to
类型: UInt64
默认值: 24
如果列名太长,则将其截断到该长度。
如果列名的长度超过 output_format_pretty_max_column_name_width_cut_to
加 output_format_pretty_max_column_name_width_min_chars_to_cut
,则列名将被截断。
output_format_pretty_max_column_name_width_min_chars_to_cut
类型: UInt64
默认值: 4
如果列名太长,最少要截断的字符数。
如果列名的长度超过 output_format_pretty_max_column_name_width_cut_to
加 output_format_pretty_max_column_name_width_min_chars_to_cut
,则列名将被截断。
output_format_pretty_max_column_pad_width
类型: UInt64
默认值: 250
在 Pretty 格式中填充列中所有值的最大宽度。
output_format_pretty_max_rows
类型: UInt64
默认值: 1000
Pretty 格式的行数限制。
output_format_pretty_max_value_width
类型: UInt64
默认值: 10000
在 Pretty 格式中显示的值的最大宽度。如果更大,值将被截断。 值 0 表示——永远不截断。
output_format_pretty_max_value_width_apply_for_single_value
类型: UInt64
默认值: 0
仅在块中不是单一值时截断值(参见 output_format_pretty_max_value_width
设置)。否则,完整输出,这对于 SHOW CREATE TABLE
查询非常有用。
output_format_pretty_multiline_fields
类型: Bool
默认值: 1
如果启用,Pretty 格式将在表格单元格内呈现多行字段,因此表格的大纲将被保留。 如果不这样做,它们将按原样呈现,可能会变形表格(关闭时的一个优点是,复制粘贴多行值会更容易)。
output_format_pretty_row_numbers
类型: Bool
默认值: 1
在每行前添加行号以进行漂亮的输出格式。
output_format_pretty_single_large_number_tip_threshold
类型: UInt64
默认值: 1000000
如果块由一个超出该值的单一数字组成(不包括 0),则在表的右侧打印可读的数字提示。
output_format_pretty_squash_consecutive_ms
类型: UInt64
默认值: 50
等待下一个块,最多指定毫秒数,并在写入之前将其压扁到前一个块。 这避免了输出过小的块,但仍然可以以流式方式显示数据。
output_format_pretty_squash_max_wait_ms
类型: UInt64
默认值: 1000
如果自上一个输出以来经过的时间超过指定的毫秒数,则在 Pretty 格式中输出待定块。
output_format_protobuf_nullables_with_google_wrappers
类型: Bool
默认值: 0
序列化带 Google 包装器的 Nullable 列时,将默认值序列化为空包装器。如果关闭,默认值和空值将不会被序列化。
output_format_schema
类型: String
默认值:
自动生成的模式将保存到 Cap'n Proto 或 Protobuf 格式的文件路径。
output_format_sql_insert_include_column_names
类型: Bool
默认值: 1
在 INSERT 查询中包含列名。
output_format_sql_insert_max_batch_size
类型: UInt64
默认值: 65409
一个 INSERT 语句中的最大行数。
output_format_sql_insert_quote_names
类型: Bool
默认值: 1
用 '`' 字符引用列名。
output_format_sql_insert_table_name
类型: String
默认值: table
输出 INSERT 查询中的表名。
output_format_sql_insert_use_replace
类型: Bool
默认值: 0
使用 REPLACE 语句而不是 INSERT。
output_format_tsv_crlf_end_of_line
类型: Bool
默认值: 0
如果设置为 true,TSV 格式中的行尾将为 \r\n,而不是 \n。
output_format_values_escape_quote_with_quote
类型: Bool
默认值: 0
如果为 true,则使用 '' 转义 ',否则使用 \' 引号。
output_format_write_statistics
类型: Bool
默认值: 1
输出格式中写入关于读取的行、字节、耗时的统计信息。
默认启用。
precise_float_parsing
类型: Bool
默认值: 0
优先使用更精确(但较慢)的浮点解析算法。
regexp_dict_allow_hyperscan
类型: Bool
默认值: 1
允许 regexp_tree 字典使用 Hyperscan 库。
regexp_dict_flag_case_insensitive
类型: Bool
默认值: 0
对于 regexp_tree 字典使用不区分大小写的匹配。可以在单个表达式中使用 (?i) 和 (?-i) 覆盖。
regexp_dict_flag_dotall
类型: Bool
默认值: 0
允许 '.' 匹配换行符以用于 regexp_tree 字典。
rows_before_aggregation
类型: Bool
默认值: 0
启用时,ClickHouse 将提供行聚合前读取的确切行数的统计信息。
schema_inference_hints
类型: String
默认值:
用于未指定模式格式的模式推断的提示列名和类型列表。
示例:
查询:
结果:
如果 schema_inference_hints
格式不正确,或者存在拼写错误或数据类型错误等... 则整个 schema_inference_hints 将被忽略。
schema_inference_make_columns_nullable
类型: UInt64Auto
默认值: 1
控制在模式推断中推断类型是否为 Nullable
。
如果启用,所有推断类型将为 Nullable
;如果禁用,推断类型将永远不是 Nullable
;如果设置为 auto
,则仅在解析的样本中包含 NULL
或文件元数据包含关于列可空性的信息时,推断类型将为 Nullable
。
schema_inference_make_json_columns_nullable
类型: Bool
默认值: 0
控制在模式推断中推断的 JSON 类型是否为 Nullable
。
如果在启用了 schema_inference_make_columns_nullable
设置时该设置也启用,则推断的 JSON 类型将为 Nullable
。
schema_inference_mode
类型: SchemaInferenceMode
默认值: default
模式推断的模式。‘default’ - 假设所有文件具有相同的模式,且可以从任何文件推断模式,‘union’ - 文件可以具有不同的模式,结果模式应为所有文件模式的联合。
show_create_query_identifier_quoting_rule
类型: IdentifierQuotingRule
默认值: when_necessary
在 SHOW CREATE 查询中设置标识符的引用规则。
show_create_query_identifier_quoting_style
类型: IdentifierQuotingStyle
默认值: Backticks
在 SHOW CREATE 查询中设置标识符的引用样式。
type_json_skip_duplicated_paths
类型: Bool
默认值: 0
启用时,在将 JSON 对象解析为 JSON 类型时,将忽略重复的路径,仅插入第一个路径,而不是引发异常。
validate_experimental_and_suspicious_types_inside_nested_types
类型: Bool
默认值: 1
验证嵌套类型(如 Array/Map/Tuple)中实验性和可疑类型的使用。