BSONEachRow
| Input | Output | Alias |
|---|---|---|
| ✔ | ✔ |
説明
BSONEachRow フォーマットは、データを区切りなしの連続した Binary JSON (BSON) ドキュメントのシーケンスとして解釈します。
各行は 1 つのドキュメントとして表現され、各列は列名をキーとする 1 つの BSON ドキュメントフィールドとして表現されます。
データ型の対応
出力時には、ClickHouse の型と BSON の型の間で次の対応を使用します。
| ClickHouse type | BSON Type |
|---|---|
| Bool | \x08 boolean |
| Int8/UInt8/Enum8 | \x10 int32 |
| Int16/UInt16/Enum16 | \x10 int32 |
| Int32 | \x10 int32 |
| UInt32 | \x12 int64 |
| Int64/UInt64 | \x12 int64 |
| Float32/Float64 | \x01 double |
| Date/Date32 | \x10 int32 |
| DateTime | \x12 int64 |
| DateTime64 | \x09 datetime |
| Decimal32 | \x10 int32 |
| Decimal64 | \x12 int64 |
| Decimal128 | \x05 binary、\x00 binary サブタイプ、サイズ = 16 |
| Decimal256 | \x05 binary、\x00 binary サブタイプ、サイズ = 32 |
| Int128/UInt128 | \x05 binary、\x00 binary サブタイプ、サイズ = 16 |
| Int256/UInt256 | \x05 binary、\x00 binary サブタイプ、サイズ = 32 |
| String/FixedString | \x05 binary、\x00 binary サブタイプ、または設定 output_format_bson_string_as_string が有効な場合は \x02 string |
| UUID | \x05 binary、\x04 uuid サブタイプ、サイズ = 16 |
| Array | \x04 array |
| Tuple | \x04 array |
| Named Tuple | \x03 document |
| Map | \x03 document |
| IPv4 | \x10 int32 |
| IPv6 | \x05 binary、\x00 binary サブタイプ |
入力時には、BSON の型と ClickHouse の型の間で次の対応を使用します。
| BSON Type | ClickHouse Type |
|---|---|
\x01 double | Float32/Float64 |
\x02 string | String/FixedString |
\x03 document | Map/Named Tuple |
\x04 array | Array/Tuple |
\x05 binary, \x00 binary subtype | String/FixedString/IPv6 |
\x05 binary, \x02 old binary subtype | String/FixedString |
\x05 binary, \x03 old uuid subtype | UUID |
\x05 binary, \x04 uuid subtype | UUID |
\x07 ObjectId | String/FixedString |
\x08 boolean | Bool |
\x09 datetime | DateTime64 |
\x0A null value | NULL |
\x0D JavaScript code | String/FixedString |
\x0E symbol | String/FixedString |
\x10 int32 | Int32/UInt32/Decimal32/IPv4/Enum8/Enum16 |
\x12 int64 | Int64/UInt64/Decimal64/DateTime64 |
その他の BSON 型はサポートされていません。さらに、異なる整数型どうしの変換も行われます。
たとえば、BSON の int32 値を ClickHouse の UInt8 として挿入することが可能です。
Int128/UInt128/Int256/UInt256/Decimal128/Decimal256 のような大きな整数および小数値は、バイナリサブタイプが \x00 の BSON Binary 値から解析できます。
この場合、この形式はバイナリデータのサイズが期待される値のサイズと等しいことを検証します。
注記
この形式はビッグエンディアンプラットフォームでは正しく動作しません。
使用例
データの挿入
次のデータを含む、football.bson という名前の BSON ファイルを使用します。
データの挿入:
データの読み込み
BSONEachRow 形式を使用してデータを読み込みます。
ヒント
BSON はバイナリ形式のデータであり、ターミナル上では人間が読める形では表示されません。INTO OUTFILE を使用して BSON ファイルとして出力してください。
フォーマット設定
| 設定 | 説明 | 既定値 |
|---|---|---|
output_format_bson_string_as_string | String 列に対しては、Binary 型ではなく BSON の String 型を使用します。 | false |
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference | BSONEachRow フォーマットのスキーマ推論時に、サポートされていない型を持つ列をスキップすることを許可します。 | false |