Format Settings
これらの設定は source から自動生成されます。
allow_special_bool_values_inside_variant
"on"、"off"、"enable"、"disable" などの特別なテキストのブール値を Variant 型の中で解析できるようにします。
bool_false_representation
TSV/CSV/Vertical/Pretty フォーマットでの false のブール値を表現するテキストです。
bool_true_representation
TSV/CSV/Vertical/Pretty フォーマットでの true のブール値を表現するテキストです。
column_names_for_schema_inference
カラム名のリストで、カラム名がないフォーマットのスキーマ推論に使用します。フォーマット: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
WHERE セクションに結合式がある場合、カンマ/クロス結合の代わりに内部結合を使用します。値: 0 - 書き換えなし、1 - 可能であればカンマ/クロスに適用、2 - すべてのカンマ結合を強制的に書き換え、cross - 可能な場合
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
datetime64 値の末尾のゼロを動的にカットし、出力スケールを [0, 3, 6] に調整します。これにより '秒'、'ミリ秒'、および 'マイクロ秒' に対応します。
date_time_input_format
日付と時間のテキスト表現のパーサーを選択できるようにします。
この設定は date and time functions には適用されません。
可能な値:
-
'best_effort'
— 拡張パーシングを有効にします。ClickHouse は基本的な
YYYY-MM-DD HH:MM:SS
フォーマットおよびすべての ISO 8601 日付と時間フォーマットを解析できます。例えば、'2018-06-08T01:02:03.000Z'
。 -
'basic'
— 基本的なパーサを使用します。ClickHouse は基本的な
YYYY-MM-DD HH:MM:SS
またはYYYY-MM-DD
フォーマットしか解析できません。例えば、2019-08-20 10:18:56
または2019-08-20
。
Cloud のデフォルト値: 'best_effort'
。
参考もご覧ください:
date_time_output_format
日付と時間のテキスト表現の異なる出力フォーマットを選択できるようにします。
可能な値:
-
simple
- シンプルな出力フォーマット。ClickHouse は日付と時間を
YYYY-MM-DD hh:mm:ss
フォーマットで出力します。例えば、2019-08-20 10:18:56
。計算はデータ型のタイムゾーン(存在する場合)またはサーバーのタイムゾーンに従います。 -
iso
- ISO 出力フォーマット。ClickHouse は日付と時間を ISO 8601
YYYY-MM-DDThh:mm:ssZ
フォーマットで出力します。例えば、2019-08-20T10:18:56Z
。出力は UTC であることに注意してください(Z
は UTC を意味します)。 -
unix_timestamp
- Unix タイムスタンプ出力フォーマット。ClickHouse は日付と時間を Unix タイムスタンプ フォーマットで出力します。例えば
1566285536
。
参考もご覧ください:
date_time_overflow_behavior
Date、Date32、DateTime、DateTime64 または整数が Date、Date32、DateTime または DateTime64 に変換されるとき、この値が結果の型で表されない場合の動作を定義します。
可能な値:
ignore
— オーバーフローを静かに無視します。結果は未定義です。throw
— オーバーフローが発生した場合に例外をスローします。saturate
— 結果を飽和させます。値がターゲット型で表現可能な最小値より小さい場合、結果は表現可能な最小値として選択されます。値がターゲット型で表現可能な最大値より大きい場合、結果は表現可能な最大値として選択されます。
デフォルト値: ignore
。
dictionary_use_async_executor
辞書ソースを複数のスレッドで読み込むためのパイプラインを実行します。これは、ローカル CLICKHOUSE ソースを持つ辞書でのみサポートされています。
errors_output_format
エラーをテキスト出力に書き込む方法です。
exact_rows_before_limit
有効にすると、ClickHouse は rows_before_limit_at_least 統計の正確な値を提供しますが、制限前のデータを完全に読み取る必要があるコストを伴います。
format_avro_schema_registry_url
AvroConfluent フォーマット用: Confluent スキーマレジストリの URL。
format_binary_max_array_size
RowBinary フォーマットでの配列の最大許可サイズ。この設定は、破損したデータのケースで大きなメモリを割り当てるのを防ぎます。0 は制限がないことを意味します。
format_binary_max_string_size
RowBinary フォーマットでの文字列の最大許可サイズ。この設定は、破損したデータのケースで大きなメモリを割り当てるのを防ぎます。0 は制限がないことを意味します。
format_capn_proto_enum_comparising_mode
ClickHouse Enum と CapnProto Enum をマッピングする方法。
format_capn_proto_use_autogenerated_schema
format_schema が設定されていない場合に自動生成された CapnProto スキーマを使用します。
format_csv_allow_double_quotes
true に設定されている場合、ダブルクォートで囲まれた文字列を許可します。
format_csv_allow_single_quotes
true に設定されている場合、シングルクォートで囲まれた文字列を許可します。
format_csv_delimiter
CSV データ内でデリミタとして考慮される文字。文字列として設定する場合、長さは 1 でなければなりません。
format_csv_null_representation
CSV フォーマットでのカスタム NULL 表現。
format_custom_escaping_rule
フィールドエスケープルール (カスタム区切りフォーマット用)。
format_custom_field_delimiter
フィールド間のデリミタ (カスタム区切りフォーマット用)。
format_custom_result_after_delimiter
結果セットの後のサフィックス (カスタム区切りフォーマット用)。
format_custom_result_before_delimiter
結果セットの前のプレフィックス (カスタム区切りフォーマット用)。
format_custom_row_after_delimiter
最後のカラムのフィールド後のデリミタ (カスタム区切りフォーマット用)。
format_custom_row_before_delimiter
フィールドの最初のカラムの前のデリミタ (カスタム区切りフォーマット用)。
format_custom_row_between_delimiter
行間のデリミタ (カスタム区切りフォーマット用)。
format_display_secrets_in_show_and_select
テーブル、データベース、テーブル関数、辞書のための SHOW
と SELECT
クエリでシークレットを表示するかどうかを有効または無効にします。
シークレットを表示したいユーザーは、display_secrets_in_show_and_select
サーバー設定 をオンにしなければならず、displaySecretsInShowAndSelect
権限も必要です。
可能な値:
- 0 — 無効。
- 1 — 有効。
format_json_object_each_row_column_for_object_name
JSON オブジェクト形式 ( /interfaces/formats/JSONObjectEachRow ) でオブジェクト名を格納/書き込むために使用されるカラムの名前。カラムの型は String です。値が空の場合は、デフォルトの名前 row_{i}
がオブジェクト名に使用されます。
format_protobuf_use_autogenerated_schema
format_schema が設定されていない場合に自動生成された Protobuf を使用します。
format_regexp
正規表現 (Regexp フォーマット用)。
format_regexp_escaping_rule
フィールドエスケープルール (Regexp フォーマット用)。
format_regexp_skip_unmatched
正規表現に一致しない行をスキップします (Regexp フォーマット用)。
format_schema
このパラメータは、Cap'n Proto や Protobuf など、スキーマ定義が必要なフォーマットを使用するときに便利です。値はフォーマットによって異なります。
format_template_resultset
結果セットのフォーマット文字列を含むファイルへのパス (テンプレートフォーマット用)。
format_template_resultset_format
結果セットのフォーマット文字列 (テンプレートフォーマット用)。
format_template_row
行のフォーマット文字列を含むファイルへのパス (テンプレートフォーマット用)。
format_template_row_format
行のフォーマット文字列 (テンプレートフォーマット用)。
format_template_rows_between_delimiter
行間のデリミタ (テンプレートフォーマット用)。
format_tsv_null_representation
TSV フォーマットでのカスタム NULL 表現。
input_format_allow_errors_num
テキストフォーマット (CSV、TSV など) から読み取る際に許容される最大エラー数を設定します。
デフォルト値は 0 です。
常に input_format_allow_errors_ratio
とペアで使用します。
行を読み取る際にエラーが発生したがエラーカウンタがまだ input_format_allow_errors_num
より少ない場合、ClickHouse は行を無視し次の行に進みます。
input_format_allow_errors_num
と input_format_allow_errors_ratio
の両方が超えた場合、ClickHouse は例外をスローします。
input_format_allow_errors_ratio
テキストフォーマット (CSV、TSV など) から読み取る際に許容される最大エラーの割合を設定します。このエラーの割合は 0 と 1 の間の浮動小数点数として設定されます。
デフォルト値は 0 です。
常に input_format_allow_errors_num
とペアで使用します。
行を読み取る際にエラーが発生したがエラーカウンタがまだ input_format_allow_errors_ratio
より少ない場合、ClickHouse は行を無視し次の行に進みます。
input_format_allow_errors_num
と input_format_allow_errors_ratio
の両方が超えた場合、ClickHouse は例外をスローします。
input_format_allow_seeks
ORC/Parquet/Arrow 入力フォーマットを読み取る際にシークを許可します。
デフォルトで有効です。
input_format_arrow_allow_missing_columns
Arrow 入力フォーマットを読み取る際に欠落しているカラムを許可します。
input_format_arrow_case_insensitive_column_matching
Arrow カラムと CH カラムの一致において、大文字と小文字を無視します。
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Arrow フォーマットのスキーマ推論の際に、サポートされていない型のカラムをスキップします。
input_format_avro_allow_missing_fields
Avro/AvroConfluent フォーマット用:スキーマでフィールドが見つからない場合、エラーの代わりにデフォルト値を使用します。
input_format_avro_null_as_default
Avro/AvroConfluent フォーマット用:NULL ケースおよび非 Nullable カラムの場合、デフォルトを挿入します。
input_format_binary_decode_types_in_binary_format
RowBinaryWithNamesAndTypes 入力フォーマットにおいて、型名の代わりにバイナリフォーマットでデータ型を読み取ります。
input_format_binary_read_json_as_string
RowBinary 入力フォーマットで JSON データ型の値を JSON String 値として読み取ります。
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
BSON フォーマットのスキーマ推論の際に、サポートされていない型のフィールドをスキップします。
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
CapnProto フォーマットのスキーマ推論の際に、サポートされていない型のカラムをスキップします。
input_format_csv_allow_cr_end_of_line
true に設定されている場合、\r を行の終わりに許可します。
input_format_csv_allow_variable_number_of_columns
CSV 入力で追加のカラムを無視し、欠落した CSV フィールドをデフォルト値として扱います(ファイルに期待される以上のカラムがある場合)。
input_format_csv_allow_whitespace_or_tab_as_delimiter
CSV 文字列内でスペースとタブ (\t) をフィールドデリミタとして使用することを許可します。
input_format_csv_arrays_as_nested_csv
CSV から配列を読み取る場合、その要素がネストされた CSV でシリアライズされ、その後文字列に格納されることを期待します。例: "[""Hello"", ""world"", ""42"""" TV""]"。配列のブラケットは省略できます。
input_format_csv_deserialize_separate_columns_into_tuple
true に設定されている場合、CSV フォーマットで記述された別々のカラムはタプルカラムにデシリアライズされる可能性があります。
input_format_csv_detect_header
CSV フォーマットで名前と型を含むヘッダーを自動的に検出します。
input_format_csv_empty_as_default
CSV 入力内の空のフィールドをデフォルト値として扱います。
input_format_csv_enum_as_number
CSV フォーマット内の列挙値を列挙インデックスとして扱います。
input_format_csv_skip_first_lines
CSV フォーマットのデータの冒頭で指定された行数をスキップします。
input_format_csv_skip_trailing_empty_lines
CSV フォーマットで末尾の空行をスキップします。
input_format_csv_trim_whitespaces
CSV 文字列の先頭と末尾のスペースとタブ (\t) 文字をトリミングします。
input_format_csv_try_infer_numbers_from_strings
有効にすると、スキーマ推論中に ClickHouse は文字列フィールドから数値を推測しようとします。これにより、CSV データが引用符付きの UInt64 数値を含む場合に便利です。
デフォルトでは無効です。
input_format_csv_try_infer_strings_from_quoted_tuples
入力データ内の引用符付きタプルを文字列型の値として解釈します。
input_format_csv_use_best_effort_in_schema_inference
CSV フォーマットでスキーマを推論するために、いくつかの微調整やヒューリスティックを使用します。
input_format_csv_use_default_on_bad_values
CSV フィールドのデシリアライズ中に不良値が発生した場合、カラムにデフォルト値を設定します。
input_format_custom_allow_variable_number_of_columns
カスタム区切り入力内の追加のカラムを無視し、カスタム区切り入力内の欠落フィールドをデフォルト値として扱います(ファイルに期待される以上のカラムがある場合)。
input_format_custom_detect_header
カスタム区切りフォーマット内の名前と型を含むヘッダーを自動的に検出します。
input_format_custom_skip_trailing_empty_lines
カスタム区切りフォーマット内で末尾の空行をスキップします。
input_format_defaults_for_omitted_fields
INSERT
クエリを実行する際に、指定されていない入力カラムの値をそれぞれのカラムのデフォルト値で置き換えます。このオプションは JSONEachRow (および他の JSON フォーマット)、CSV、TabSeparated、TSKV、Parquet、Arrow、Avro、ORC、Native フォーマットおよび WithNames
/WithNamesAndTypes
サフィックスを持つフォーマットに適用されます。
このオプションが有効な場合、サーバーからクライアントに拡張テーブルメタデータが送信されます。これはサーバー上で追加の計算リソースを消費し、パフォーマンスを低下させる可能性があります。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_force_null_for_omitted_fields
省略されたフィールドをデフォルト値として null で初期化します。
input_format_hive_text_allow_variable_number_of_columns
Hive テキスト入力内の追加のカラムを無視し、Hive テキスト入力内の欠落フィールドをデフォルト値として扱います(ファイルに期待される以上のカラムがある場合)。
input_format_hive_text_collection_items_delimiter
Hive テキストファイル内のコレクション(配列またはマップ)アイテム間のデリミタ。
input_format_hive_text_fields_delimiter
Hive テキストファイル内のフィールド間のデリミタ。
input_format_hive_text_map_keys_delimiter
Hive テキストファイル内のマップキー/値のペアの間のデリミタ。
input_format_import_nested_json
ネストされたオブジェクトを持つ JSON データの挿入を有効または無効にします。
サポートされているフォーマット:
可能な値:
- 0 — 無効。
- 1 — 有効。
参考もご覧ください:
input_format_ipv4_default_on_conversion_error
IPv4 のデシリアライズでは、変換エラー時にデフォルト値を使用します。
デフォルトでは無効です。
input_format_ipv6_default_on_conversion_error
IPV6 のデシリアライズでは、変換エラー時にデフォルト値を使用します。
デフォルトでは無効です。
input_format_json_compact_allow_variable_number_of_columns
JSONCompact/JSONCompactEachRow 入力フォーマットでの行における変動数のカラムを許可します。行に期待される以上のカラムがある場合、追加のカラムを無視し、欠落したカラムをデフォルト値として扱います。
デフォルトでは無効です。
input_format_json_defaults_for_missing_elements_in_named_tuple
名前付きタプルを解析する際、JSON オブジェクト内の欠落要素にデフォルト値を挿入します。この設定は input_format_json_named_tuples_as_objects
が有効な場合にのみ機能します。
デフォルトでは有効です。
input_format_json_empty_as_default
有効な場合、JSON 内の空の入力フィールドをデフォルト値に置き換えます。複雑なデフォルト式の場合は、input_format_defaults_for_omitted_fields
も有効にしなければなりません。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_json_ignore_unknown_keys_in_named_tuple
名前付きタプルの JSON オブジェクトで不明なキーを無視します。
デフォルトでは有効です。
input_format_json_ignore_unnecessary_fields
不要なフィールドを無視し、解析しません。これを有効にすると、不正なフォーマットの JSON 文字列や重複しているフィールドに対する例外がスローされない場合があります。
input_format_json_infer_incomplete_types_as_strings
スキーマ推論中に、データサンプル内で Null
/{}
/[]
のみを含む JSON キーに対して String 型を使用できるようにします。JSON フォーマットでは、任意の値を文字列として読み取ることができ、スキーマ推論中に column_name
のタイプを決定できなかった場合のようなエラーを回避できます。
例:
結果:
デフォルトでは有効です。
input_format_json_max_depth
JSON 内のフィールドの最大深度です。これは厳密な制限ではなく、正確に適用する必要はありません。
input_format_json_named_tuples_as_objects
名前付きタプルカラムを JSON オブジェクトとして解析します。
デフォルトでは有効です。
input_format_json_read_arrays_as_strings
JSON 入力フォーマットで JSON 配列を文字列として解析できるようにします。
例:
結果:
デフォルトでは有効です。
input_format_json_read_bools_as_numbers
JSON 入力フォーマットでブール値を数値として解析できるようにします。
デフォルトでは有効です。
input_format_json_read_bools_as_strings
JSON 入力フォーマットでブール値を文字列として解析できるようにします。
デフォルトでは有効です。
input_format_json_read_numbers_as_strings
JSON 入力フォーマットで数値を文字列として解析できるようにします。
デフォルトでは有効です。
input_format_json_read_objects_as_strings
JSON 入力フォーマットで JSON オブジェクトを文字列として解析できるようにします。
例:
結果:
デフォルトでは有効です。
input_format_json_throw_on_bad_escape_sequence
JSON 入力フォーマットで JSON 文字列に不正なエスケープシーケンスが含まれている場合、例外をスローします。無効にすると、不正なエスケープシーケンスはデータにそのまま残ります。
デフォルトでは有効です。
input_format_json_try_infer_named_tuples_from_objects
有効な場合、スキーマ推論中に ClickHouse は JSON オブジェクトから名前付きタプルを推測しようとします。生成された名前付きタプルは、サンプルデータから対応するすべての JSON オブジェクトの要素を含みます。
例:
結果:
デフォルトでは有効です。
input_format_json_try_infer_numbers_from_strings
有効にすると、スキーマの推論中にClickHouseは文字列フィールドから数値を推測しようとします。 これは、JSONデータが引用符で囲まれたUInt64の数値を含む場合に便利です。
デフォルトでは無効です。
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
名前付きタプルの推論中にJSONオブジェクトのあいまいなパスの場合、例外ではなくString型を使用します。
input_format_json_validate_types_from_metadata
JSON/JSONCompact/JSONColumnsWithMetadata入力形式の場合、この設定が1に設定されていると、 入力データのメタデータからの型がテーブルの対応するカラムの型と比較されます。
デフォルトでは有効です。
input_format_max_block_size_bytes
入力形式でデータを解析する際に形成されるブロックのサイズをバイト単位で制限します。ブロックがClickHouse側で形成される行ベースの入力形式で使用されます。 0はバイト単位で制限なしを意味します。
input_format_max_bytes_to_read_for_schema_inference
自動スキーマ推論のために読み取る最大のデータ量をバイト単位で指定します。
input_format_max_rows_to_read_for_schema_inference
自動スキーマ推論のために読み取る最大行数を指定します。
input_format_msgpack_number_of_columns
挿入されたMsgPackデータ内のカラム数。データからの自動スキーマ推論に使用されます。
input_format_mysql_dump_map_column_names
MySQLダンプ内のテーブルのカラムとClickHouseテーブルのカラムを名前で一致させます。
input_format_mysql_dump_table_name
MySQLダンプからデータを読み取るためのテーブル名
input_format_native_allow_types_conversion
ネイティブ入力形式でのデータ型の変換を許可します。
input_format_native_decode_types_in_binary_format
ネイティブ入力形式で型名の代わりにバイナリ形式でデータタイプを読み取ります。
input_format_null_as_default
データ型がnullableでない場合、NULLフィールドをデフォルト値で初期化することを有効または無効にします。
カラム型がNullableでない場合、この設定が無効にされると、NULL
を挿入すると例外が発生します。カラム型がNullableの場合、NULL
値はこの設定に関係なくそのまま挿入されます。
この設定はほとんどの入力形式に適用されます。
複雑なデフォルト式の場合、input_format_defaults_for_omitted_fields
も有効にしなければなりません。
可能な値:
- 0 — Nullableでないカラムに
NULL
を挿入すると例外が発生します。 - 1 —
NULL
フィールドはデフォルトのカラム値で初期化されます。
input_format_orc_allow_missing_columns
ORC入力形式を読み取る際に欠落しているカラムを許可します。
input_format_orc_case_insensitive_column_matching
ORCカラムとCHカラムを一致させる際に大文字と小文字を無視します。
input_format_orc_dictionary_as_low_cardinality
ORCファイルを読み取る際に、ORC辞書エンコードされたカラムをLowCardinalityカラムとして扱います。
input_format_orc_filter_push_down
ORCファイルを読み取る際に、WHERE/PREWHERE式、最小/最大統計、またはORCメタデータ内のブLOOMフィルターに基づいて、全体のストライプまたは行グループをスキップします。
input_format_orc_reader_time_zone_name
ORC行リーダーのタイムゾーン名、デフォルトのORC行リーダーのタイムゾーンはGMTです。
input_format_orc_row_batch_size
ORCストライプを読み取る際のバッチサイズです。
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
ORC形式のスキーマ推論中にサポートされていない型のカラムをスキップします。
input_format_orc_use_fast_decoder
より高速なORCデコーダ実装を使用します。
input_format_parquet_allow_geoparquet_parser
Array(UInt8)をPoint/Linestring/Polygon/MultiLineString/MultiPolygon型に変換するために、地理カラムパーサを使用します。
input_format_parquet_allow_missing_columns
Parquet入力形式を読み取る際に欠落しているカラムを許可します。
input_format_parquet_bloom_filter_push_down
Parquetファイルを読み取る際に、WHERE式とParquetメタデータ内のブLOOMフィルターに基づいて、全体の行グループをスキップします。
input_format_parquet_case_insensitive_column_matching
ParquetカラムとCHカラムを一致させる際に大文字と小文字を無視します。
input_format_parquet_enable_row_group_prefetch
Parquet解析中に行グループのプレフェッチを有効にします。現在、単一スレッドの解析のみがプレフェッチ可能です。
input_format_parquet_filter_push_down
Parquetファイルを読み取る際に、WHERE/PREWHERE式とParquetメタデータ内の最小/最大統計に基づいて、全体の行グループをスキップします。
input_format_parquet_local_file_min_bytes_for_seek
Parquet入力形式でのシークを行うために、ローカル読み取り(ファイル)の最小バイト数。
input_format_parquet_max_block_size
Parquetリーダーの最大ブロックサイズ。
input_format_parquet_prefer_block_bytes
Parquetリーダーから出力される平均ブロックバイト数。
input_format_parquet_preserve_order
Parquetファイルから読み取る際に行の順序を再配置しないようにします。通常、これにより大幅に遅くなります。
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
Parquet形式のスキーマ推論中にサポートされていない型のカラムをスキップします。
input_format_parquet_use_native_reader
Parquetファイルを読み取る際に、Arrowリーダーの代わりにネイティブリーダーを使用します。
input_format_protobuf_flatten_google_wrappers
通常の非ネストされたカラムに対してGoogleラッパーを有効にします。例えば、文字列カラム'str'のためのgoogle.protobuf.StringValue 'str'。Nullableカラムに対しては、空のラッパーがデフォルトとして認識され、欠落しているものはNULLとして扱われます。
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
Protobuf形式のスキーマ推論中にサポートされていない型のフィールドをスキップします。
input_format_record_errors_file_path
テキスト形式(CSV、TSV)を読み取る際にエラーを記録するために使用されるファイルのパス。
input_format_skip_unknown_fields
追加データの挿入をスキップすることを有効または無効にします。
データを書き込む際、ClickHouseは、入力データに対象テーブルに存在しないカラムが含まれている場合、例外をスローします。スキップが有効になっている場合、ClickHouseは追加データを挿入せず、例外をスローしません。
サポートされている形式:
- JSONEachRow(および他のJSON形式)
- BSONEachRow(および他のJSON形式)
- TSKV
- WithNames/WithNamesAndTypesの接尾辞を持つすべての形式
- MySQLDump
- Native
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_try_infer_dates
有効にすると、ClickHouseはテキスト形式のスキーマ推論中に文字列フィールドから型Date
を推測しようとします。入力データのカラムからのすべてのフィールドが日付として正常に解析された場合、結果の型はDate
になります。1つ以上のフィールドが日付として解析されなかった場合、結果の型はString
になります。
デフォルトでは有効です。
input_format_try_infer_datetimes
有効にすると、ClickHouseはテキスト形式のスキーマ推論中に文字列フィールドから型DateTime64
を推測しようとします。入力データのカラムからのすべてのフィールドが日時として正常に解析された場合、結果の型はDateTime64
になります。1つ以上のフィールドが日時として解析されなかった場合、結果の型はString
になります。
デフォルトでは有効です。
input_format_try_infer_datetimes_only_datetime64
input_format_try_infer_datetimesが有効な場合、DateTime型だけでなくDateTime64型のみを推測します。
input_format_try_infer_exponent_floats
テキスト形式のスキーマ推論中に指数表記の小数を推測しようとします(JSONを除く、指数番号は常に推測されます)。
input_format_try_infer_integers
有効にすると、ClickHouseはテキスト形式のスキーマ推論中に小数の代わりに整数を推測しようとします。入力データのカラム内のすべての数字が整数の場合、結果の型はInt64
になります。1つ以上の数字が小数の場合、結果の型はFloat64
になります。
デフォルトでは有効です。
input_format_try_infer_variants
有効にすると、複数の可能な型がカラム/配列要素にある場合、ClickHouseはテキスト形式のスキーマ推論中に型Variant
を推測します。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_tsv_allow_variable_number_of_columns
TSV入力で追加のカラムを無視します(ファイルに期待以上のカラムがある場合)および欠落しているフィールドをデフォルト値として扱います。
input_format_tsv_crlf_end_of_line
trueに設定されている場合、ファイル関数はTSV形式を\r\nで読み取ります。
input_format_tsv_detect_header
TSV形式で名前と型のヘッダーを自動的に検出します。
input_format_tsv_empty_as_default
TSV入力で空のフィールドをデフォルト値として扱います。
input_format_tsv_enum_as_number
TSV形式で挿入された列挙型の値を列挙型インデックスとして扱います。
input_format_tsv_skip_first_lines
TSV形式のデータの最初の指定行数をスキップします。
input_format_tsv_skip_trailing_empty_lines
TSV形式で最後の空の行をスキップします。
input_format_tsv_use_best_effort_in_schema_inference
TSV形式のスキーマ推論を推測するためのトリックやヒューリスティックをいくつか使用します。
input_format_values_accurate_types_of_literals
Values形式の場合: テンプレートを使用して式を解析および解釈する際、オーバーフローや精度の問題を回避するためにリテラルの実際の型を確認します。
input_format_values_deduce_templates_of_expressions
Values形式の場合: フィールドがストリーミングパーサーによって解析できなかった場合、SQLパーサーを実行し、SQL式のテンプレートを推測し、テンプレートを使用してすべての行を解析し、その後すべての行に対して式を解釈しようとします。
input_format_values_interpret_expressions
Values形式の場合: フィールドがストリーミングパーサーによって解析できなかった場合、SQLパーサーを実行し、SQL式として解釈しようとします。
input_format_with_names_use_header
データを挿入する際にカラムの順序を確認することを有効または無効にします。
挿入性能を向上させるために、入力データのカラム順序が対象テーブルの順序と同じであると確信している場合は、このチェックを無効にすることをお勧めします。
サポートされている形式:
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_with_types_use_header
フォーマットパーサーが入力データのデータ型がターゲットテーブルのデータ型と一致するかどうかを確認するかを制御します。
サポートされている形式:
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
可能な値:
- 0 — 無効。
- 1 — 有効。
insert_distributed_one_random_shard
スキーマがない場合にDistributedテーブルへのランダムシャード挿入を有効または無効にします。
デフォルトでは、1つ以上のシャードを持つDistributed
テーブルにデータを挿入する際、分散キーがない場合はClickHouseサーバーがすべての挿入リクエストを拒否します。insert_distributed_one_random_shard = 1
の場合、挿入が許可され、データはすべてのシャード間でランダムに転送されます。
可能な値:
- 0 — 複数のシャードがあり、分散キーが指定されていない場合、挿入は拒否されます。
- 1 — 分散キーが指定されていない場合、すべての利用可能なシャードの間でランダムに挿入されます。
interval_output_format
間隔型のテキスト表現の異なる出力形式を選択できるようにします。
可能な値:
-
kusto
- KQLスタイルの出力形式。ClickHouseは、KQL形式で間隔を出力します。例えば、
toIntervalDay(2)
は2.00:00:00
としてフォーマットされます。長さが異なる間隔型(例:IntervalMonth
やIntervalYear
)の場合、平均的な秒数が間隔として考慮されます。 -
numeric
- 数値出力形式。ClickHouseは、間隔をその基礎となる数値表現として出力します。例えば、
toIntervalDay(2)
は2
としてフォーマットされます。
見て下さい:
output_format_arrow_compression_method
Arrow出力形式の圧縮方法。サポートされているコーデック:lz4_frame、zstd、none(非圧縮)
output_format_arrow_fixed_string_as_fixed_byte_array
FixedStringカラムのためにArrow FIXED_SIZE_BINARY型をBinaryの代わりに使用します。
output_format_arrow_low_cardinality_as_dictionary
LowCardinality型をArrow型のDictionaryとして出力することを有効にします。
output_format_arrow_string_as_string
StringカラムのためにArrow String型をBinaryの代わりに使用します。
output_format_arrow_use_64_bit_indexes_for_dictionary
Arrow形式で辞書インデックスに常に64ビット整数を使用します。
output_format_arrow_use_signed_indexes_for_dictionary
Arrow形式で辞書インデックスに符号付き整数を使用します。
output_format_avro_codec
圧縮コーデックの出力に使用されます。可能な値:'null', 'deflate', 'snappy', 'zstd'。
output_format_avro_rows_in_file
ファイル中の最大行数(ストレージで許可されている場合)。
output_format_avro_string_column_pattern
Avro形式のため:AVRO文字列として選択するString列の正規表現。
output_format_avro_sync_interval
バイト単位の同期間隔。
output_format_binary_encode_types_in_binary_format
RowBinaryWithNamesAndTypes出力形式で型名の代わりにデータ型をバイナリ形式で書き込みます。
output_format_binary_write_json_as_string
RowBinary出力形式でJSONデータ型の値をStringカラムでJSON文字列を含む形に書き込みます。
output_format_bson_string_as_string
StringカラムのためにBSON String型をBinaryの代わりに使用します。
output_format_csv_crlf_end_of_line
trueに設定されている場合、CSV形式の行の終わりは\r\nになります。
output_format_csv_serialize_tuple_into_separate_columns
trueに設定されている場合、CSV形式のタプルは別々のカラムとしてシリアライズされます(つまり、タプル内でのネストが失われます)。
output_format_decimal_trailing_zeros
Decimal値を出力する際に末尾のゼロを出力します。例:1.230000ではなく1.23。
デフォルトでは無効です。
output_format_json_array_of_rows
JSONEachRow形式で、すべての行をJSON配列として出力する機能を有効にします。
可能な値:
- 1 — ClickHouseはすべての行を配列として出力します。各行は
JSONEachRow
形式になります。 - 0 — ClickHouseは各行を
JSONEachRow
形式で別々に出力します。
有効な設定のクエリの例
クエリ:
結果:
無効な設定のクエリの例
クエリ:
結果:
output_format_json_escape_forward_slashes
JSON出力形式での文字列出力のためのスラッシュのエスケープを制御します。これはJavaScriptとの互換性のために意図されています。常にエスケープされるバックスラッシュと混同しないでください。
デフォルトでは有効です。
output_format_json_named_tuples_as_objects
名前付きタプルカラムをJSONオブジェクトとしてシリアライズします。
デフォルトでは有効です。
output_format_json_pretty_print
有効な場合、JSON出力形式の'data'セクション内のTuple/Array/Mapのような複雑なデータ型の値は、整形された形式で印刷されます。
デフォルトでは有効です。
output_format_json_quote_64bit_floats
JSON*形式で出力される際に64ビット浮動小数点数の引用を制御します。
デフォルトでは無効です。
output_format_json_quote_64bit_integers
JSON形式で出力される際に64ビットまたはそれ以上の整数(UInt64
またはInt128
のような)の引用を制御します。
そのような整数はデフォルトで引用符で囲まれます。この動作はほとんどのJavaScript実装と互換性があります。
可能な値:
- 0 — 整数は引用符なしで出力されます。
- 1 — 整数は引用符で囲まれます。
output_format_json_quote_decimals
JSON出力形式での小数の引用を制御します。
デフォルトでは無効です。
output_format_json_quote_denormals
JSON出力形式で+nan
、-nan
、+inf
、-inf
の出力を有効にします。
可能な値:
- 0 — 無効。
- 1 — 有効。
例
次のテーブル account_orders
を考慮します:
output_format_json_quote_denormals = 0
のとき、クエリは出力にnull
値を返します:
output_format_json_quote_denormals = 1
のとき、クエリは次のようになります:
output_format_json_skip_null_value_in_named_tuples
名前付きタプルのカラムをJSONオブジェクトとしてシリアライズする際に、NULL値のあるキーと値のペアをスキップします。これは、output_format_json_named_tuples_as_objectsがtrueのときにのみ有効です。
output_format_json_validate_utf8
JSON出力形式でのUTF-8シーケンスの検証を制御します。これは、JSON/JSONCompact/JSONColumnsWithMetadata形式には影響しません。これらは常にUTF-8を検証します。
デフォルトでは無効です。
output_format_markdown_escape_special_characters
有効にすると、Markdown内の特殊文字をエスケープします。
Common Markは、次の特殊文字をエスケープできると定義しています:
可能な値:
- 0 — 無効。
- 1 — 有効。
output_format_msgpack_uuid_representation
MsgPack形式でUUIDを出力する方法。
output_format_native_encode_types_in_binary_format
ネイティブ出力形式で型名の代わりにデータ型をバイナリ形式で書き込みます。
output_format_native_write_json_as_string
JSONカラムのデータを、デフォルトのネイティブJSONシリアル化の代わりにJSON文字列を含むStringカラムとして書き込みます。
output_format_orc_compression_method
ORC出力形式の圧縮方法。サポートされているコーデック:lz4、snappy、zlib、zstd、none(非圧縮)
output_format_orc_dictionary_key_size_threshold
ORC出力形式の文字列カラムにおいて、異なる値の数が非NULL行の総数のこの割合を超える場合、辞書エンコーディングをオフにします。そうでない場合は辞書エンコーディングが有効になります。
結果:
output_format_pretty_display_footer_column_names_min_rows
設定 output_format_pretty_display_footer_column_names が有効な場合、フッターにカラム名が表示される最低行数を設定します。
output_format_pretty_fallback_to_vertical
有効な場合、テーブルが広いが短い場合、Pretty フォーマットは Vertical フォーマットのように出力します。
この動作を詳細に調整するには、 output_format_pretty_fallback_to_vertical_max_rows_per_chunk
と output_format_pretty_fallback_to_vertical_min_table_width
を参照してください。
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Vertical フォーマットへのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、チャンク内のレコード数が指定された値を超えない場合にのみアクティブになります。
output_format_pretty_fallback_to_vertical_min_columns
Vertical フォーマットへのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、カラム数が指定された値を超える場合にのみアクティブになります。
output_format_pretty_fallback_to_vertical_min_table_width
Vertical フォーマットへのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、テーブル内のカラムの合計長が指定された値以上の場合、または少なくとも1つの値に改行文字が含まれている場合にアクティブになります。
output_format_pretty_glue_chunks
Pretty フォーマットで描画されたデータが複数のチャンクに分割されて到着した場合であっても、次のチャンクが前のものと同じカラム幅を持つ場合、ANSI エスケープシーケンスを用いて前の行に戻り、前のチャンクのフッターを書き換えて新しいチャンクのデータで続行します。これにより、結果が視覚的に心地よくなります。
0 - 無効、1 - 有効、'auto' - ターミナルの場合に有効。
output_format_pretty_grid_charset
グリッド境界の印刷に使用する文字セット。有効な文字セット: ASCII, UTF-8(デフォルト)。
output_format_pretty_highlight_digit_groups
有効な場合、出力がターミナルであれば、千、百万などに対応する各桁を下線で強調表示します。
output_format_pretty_highlight_trailing_spaces
有効な場合、出力がターミナルであれば、末尾のスペースをグレーで下線を引いて強調表示します。
output_format_pretty_max_column_name_width_cut_to
カラム名が長すぎる場合、この長さに切り捨てます。
カラムは output_format_pretty_max_column_name_width_cut_to
に output_format_pretty_max_column_name_width_min_chars_to_cut
を加えた長さを超える場合に切り捨てられます。
output_format_pretty_max_column_name_width_min_chars_to_cut
カラム名が長すぎる場合に切り捨てられる最低文字数。
カラムは output_format_pretty_max_column_name_width_cut_to
に output_format_pretty_max_column_name_width_min_chars_to_cut
を加えた長さを超える場合に切り捨てられます。
output_format_pretty_max_column_pad_width
Pretty フォーマットでのカラム内の全ての値をパディングする最大幅。
output_format_pretty_max_rows
Pretty フォーマットの行数制限。
output_format_pretty_max_value_width
Pretty フォーマットに表示する値の最大幅。これを超える場合は切り捨てられます。 値 0 は - 決して切り捨てないことを意味します。
output_format_pretty_max_value_width_apply_for_single_value
もしそれがブロック内の単一の値でない場合(output_format_pretty_max_value_width
設定を参照)にのみ切り捨てます。さもなくば完全に出力し、これは SHOW CREATE TABLE
クエリに便利です。
output_format_pretty_multiline_fields
有効な場合、Pretty フォーマットはテーブルセル内にマルチラインフィールドを描画し、テーブルのアウトラインを維持します。 無効な場合、元の通りに描画され、テーブルが変形する可能性があります(オフにしておくことでの利点は、マルチライン値のコピーペーストが簡単になることです)。
output_format_pretty_row_numbers
Pretty 出力形式の各行の前に行番号を追加します
output_format_pretty_single_large_number_tip_threshold
ブロックがこの値を超える単一の数で構成される場合、テーブルの右側に可読数のヒントを印刷します(0 を除く)
output_format_pretty_squash_consecutive_ms
次のブロックの出力までに指定されたミリ秒数を待ち、書き込む前に前のものに圧縮します。 これにより、あまりにも小さなブロックの頻繁な出力を避けることができますが、データをストリーミング形式で表示することを可能にします。
output_format_pretty_squash_max_wait_ms
前の出力から指定されたミリ秒数を超えた場合、Pretty フォーマットの保留中のブロックを出力します。
output_format_protobuf_nullables_with_google_wrappers
Google ラッパーを使用して Nullable カラムをシリアライズする場合、デフォルト値を空のラッパーとしてシリアライズします。オフにすると、デフォルトおよび NULL 値はシリアライズされません。
output_format_schema
自動生成されたスキーマが Cap'n Proto または Protobuf 形式で保存されるファイルのパス。
output_format_sql_insert_include_column_names
INSERT クエリにカラム名を含める
output_format_sql_insert_max_batch_size
1つの INSERT ステートメントでの最大行数。
output_format_sql_insert_quote_names
カラム名を '`' 文字で引用します
output_format_sql_insert_table_name
出力 INSERT クエリ内のテーブル名
output_format_sql_insert_use_replace
INSERT の代わりに REPLACE ステートメントを使用します
output_format_tsv_crlf_end_of_line
これが真に設定されている場合、TSV 形式の行末は \r\n になります(\n の代わりに)。
output_format_values_escape_quote_with_quote
真であれば ' を '' でエスケープ、さもなくば \ で引用
output_format_write_statistics
適切な出力形式で読み取った行数、バイト数、経過時間の統計を記録します。
デフォルトで有効
precise_float_parsing
より正確(しかし遅い)な浮動小数点パースアルゴリズムを優先します
regexp_dict_allow_hyperscan
Hyperscan ライブラリを使用して regexp_tree 辞書を許可します。
regexp_dict_flag_case_insensitive
regexp_tree 辞書のための大文字小文字を区別しない一致を使用します。個別の式では (?i) および (?-i) で上書きできます。
regexp_dict_flag_dotall
regexp_tree 辞書のために '.' が改行文字に一致することを許可します。
rows_before_aggregation
有効な場合、ClickHouse は rows_before_aggregation 統計に正確な値を提供し、これは集約前に読み取った行数を表します。
schema_inference_hints
スキーマなしのフォーマットのスキーマ推論におけるヒントとして使用するカラム名と型のリスト。
例:
クエリ:
結果:
もし schema_inference_hints
が正しくフォーマットされていない場合、またはタイプミスや間違ったデータ型が存在する場合などは、全体の schema_inference_hints は無視されます。
schema_inference_make_columns_nullable
スキーマ推論において推論された型を Nullable
にする制御。
この設定が有効な場合、全ての推論された型は Nullable
になります。無効の場合は、推論された型は決して Nullable
にはなりません。自動に設定されている場合、推論された型はスキーマ推論中に解析されるサンプルに NULL を含む場合や、ファイルメタデータにカラムの NULL 可能性に関する情報が含まれている場合にのみ Nullable
になります。
schema_inference_make_json_columns_nullable
スキーマ推論において推論された JSON 型を Nullable
にする制御。
この設定が schema_inference_make_columns_nullable とともに有効な場合、推論された JSON 型は Nullable
になります。
schema_inference_mode
スキーマ推論のモード。'default' - すべてのファイルが同じスキーマを持つと仮定し、そのスキーマが任意のファイルから推論できる、'union' - ファイルは異なるスキーマを持つ可能性があり、結果のスキーマはすべてのファイルのスキーマのユニオンであるべきです。
show_create_query_identifier_quoting_rule
SHOW CREATE クエリ内の識別子の引用ルールを設定します。
show_create_query_identifier_quoting_style
SHOW CREATE クエリ内の識別子の引用スタイルを設定します。
type_json_skip_duplicated_paths
有効な場合、JSON オブジェクトを JSON 型に解析中に重複したパスは無視され、最初のものだけが挿入されます。
validate_experimental_and_suspicious_types_inside_nested_types
Array/Map/Tuple のようなネストされた型の中での実験的および疑わしい型の使用を検証します。