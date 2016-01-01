system.unicode
system.unicode 表是一个虚拟表，用于提供关于 Unicode 字符及其属性的信息（https://unicode-org.github.io/icu/userguide/strings/properties.html）。该表是动态生成的。
Columns
注意
ICU 文档中 Unicode 码点的属性名称会被转换为 snake_case。
code_point(String) — 码点的 UTF-8 表示。
code_point_value(Int32) — 码点的数值。
notation(String) — 码点的 Unicode 表示形式。
- Binary Properties (UInt8) - 码点的二值属性。
alphabetic,
ascii_hex_digit,
case_ignorable...
-
- Enumerated Properties (Int32) - 码点的枚举属性。
bidi_class,
bidi_paired_bracket_type,
block...
-
- String Properties (String) - 码点的字符串属性（ASCII 字符串、Unicode 字符串或码点）
case_folding,
decomposition_mapping,
name...
-
注意
映射规则有一些特殊之处，详见 ICU 文档。例如，simple_uppercase_mapping 和 uppercase_mapping 并不完全相同。但未实现任何与语言相关的映射（例如在土耳其语中，i 的大写是 "İ" (U+0130)）。
numeric_value(Float64) - 码点的数值。
script_extensions(Array(LowCardinality(String))) - 码点的书写系统扩展（script extensions）。
identifier_type(Array(LowCardinality(String))) - 码点的标识符类型。
general_category_mask(Int32) - 码点的一般类别掩码。
示例