Regexp
Input | Output | Alias |
---|---|---|
✔ | ✗ |
描述
Regex
格式根据提供的正则表达式解析每行导入的数据。
用法
来自 format_regexp 设置的正则表达式将应用于每行导入的数据。正则表达式中的子模式数量必须等于导入数据集中列的数量。
导入数据的行必须由换行符 '\n'
或 DOS 风格的换行符 "\r\n"
分隔。
每个匹配子模式的内容将通过相应数据类型的方法进行解析,这根据 format_regexp_escaping_rule 设置。
如果正则表达式不匹配该行,并且 format_regexp_skip_unmatched 设置为 1,则该行将被静默跳过。否则,将抛出异常。
示例用法
考虑文件 data.tsv
:
以及表 imp_regex_table
:
我们将使用以下查询将上述文件中的数据插入到上述表中:
现在我们可以通过 SELECT
从表中查看 Regex
格式如何解析文件中的数据:
格式设置
在使用 Regexp
格式时,可以使用以下设置: