CSV
描述
逗号分隔值格式(RFC)。当格式化时,行用双引号括起来。字符串内的双引号将输出为两个连续的双引号。 没有其他转义字符的规则。
- 日期和日期时间用双引号括起来。
- 数字不带引号输出。
- 值通过分隔符字符分隔,默认是
,
。分隔符字符在设置 format_csv_delimiter 中定义。 - 行使用Unix换行符(LF)分隔。
- 数组在CSV中序列化如下:
- 首先,数组按TabSeparated格式序列化为字符串
- 结果字符串在CSV中用双引号输出。
- CSV格式中的元组序列化为单独的列(也就是说,它们在元组中的嵌套关系丢失)。
备注
默认情况下,分隔符是 ,
。
有关更多信息,请参见 format_csv_delimiter 设置。
在解析时,所有值都可以带引号或不带引号进行解析。支持双引号和单引号。
行也可以不带引号排列。在这种情况下,它们会解析到分隔符字符或换行符(CR或LF)。 然而,违反RFC时,在无引号的行解析中,前导和尾随空格及制表符会被忽略。 换行符支持:Unix(LF),Windows(CR LF)和Mac OS Classic(CR LF)类型。
NULL
根据设置 format_csv_null_representation 格式化(默认值为 \N
)。
在输入数据中,ENUM
值可以表示为名称或ID。
首先,我们尝试将输入值匹配到ENUM名称。
如果失败,并且输入值是一个数字,我们会尝试将该数字匹配到ENUM ID。
如果输入数据只包含ENUM ID,建议启用设置 input_format_csv_enum_as_number 以优化 ENUM
解析。