Template
| Input | Output | エイリアス |
|---|---|---|
| ✔ | ✔ |
説明
他の標準フォーマットでは対応できない、より高度なカスタマイズが必要な場合に、
Template フォーマットを使用すると、値のプレースホルダーを含む独自のカスタムフォーマット文字列と、
データに対するエスケープルールをユーザーが指定できます。
このフォーマットでは、次の設定を使用します:
| 設定 | 説明 |
|---|---|
format_template_row | 行のフォーマット文字列を含むファイルへのパスを指定します。 |
format_template_resultset | 結果セットのフォーマット文字列を含むファイルへのパスを指定します。 |
format_template_rows_between_delimiter | 行と行の間の区切り文字を指定します。これは最後の行を除く各行の後に出力 (または入力として期待) されます (デフォルトは \n) 。 |
format_template_row_format | 行のフォーマット文字列をインラインで指定します。 |
format_template_resultset_format | 結果セットのフォーマット文字列をインラインで指定します。 |
他のフォーマットの一部の設定 (例: JSON エスケープを使用する場合の output_format_json_quote_64bit_integers |
設定とエスケープ規則
format_template_row
format_template_row 設定は、次の構文で行用のフォーマット文字列が記述されたファイルへのパスを指定します。
Where:
| Part of syntax | Description |
|---|---|
delimiter_i | 値同士の区切り文字 ($ 記号は $$ としてエスケープ可能) |
column_i | 値を選択または挿入する対象となる列の名前またはインデックス (空の場合、その列はスキップされる) |
serializeAs_i | 列の値に対するエスケープ規則。 |
サポートされているエスケープ規則は次のとおりです。
| Escaping Rule | Description |
|---|---|
CSV, JSON, XML | 同名のフォーマットと同様 |
Escaped | TSV と同様 |
Quoted | Values と同様 |
Raw | エスケープなしで、TSVRaw と同様 |
None | エスケープ規則なし (詳細は下記の注記を参照) |
エスケープ規則が省略された場合、None が使用されます。XML は出力にのみ適しています。
例を見てみましょう。次のフォーマット文字列が与えられているとします。
以下の値は (SELECT を使用している場合は) 出力され、 (INPUT を使用している場合は) 入力として期待されます。
それぞれ、カラム Search phrase:, , count:, , ad price: $ と ; の区切り文字の間に対応します。
s(エスケープルールQuoted)c(エスケープルールEscaped)p(エスケープルールJSON)
例:
INSERTを行う場合、下記の行は期待されるテンプレートに一致しており、カラムSearch phrase,count,ad priceにそれぞれ値bathroom interior design,2166,$3を読み込みます。SELECTを行う場合、下記の行は、値bathroom interior design,2166,$3がすでにテーブル内のカラムSearch phrase,count,ad priceに保存されていると仮定したときの出力例です。
format_template_rows_between_delimiter
format_template_rows_between_delimiter 設定は、行と行の間に出力 (または入力として期待) される区切り文字列を指定します。最後の行を除くすべての行の後に出力され、デフォルトは \n です。
format_template_resultset
format_template_resultset 設定は、結果セット用のフォーマット文字列を含むファイルへのパスを指定します。
結果セット用のフォーマット文字列は、行用のフォーマット文字列と同じ構文を持ちます。 これにより、接頭辞や接尾辞、追加情報の出力方法を指定でき、列名の代わりに次のプレースホルダーを使用します。
dataは、format_template_rowフォーマットで表現されたデータ行で、format_template_rows_between_delimiterで区切られます。このプレースホルダーは、フォーマット文字列内の先頭に配置する必要があります。totalsは、format_template_rowフォーマットで表現された合計値の行です (WITH TOTALS 使用時) 。minは、format_template_rowフォーマットで表現された最小値の行です (extremes が 1 に設定されている場合) 。maxは、format_template_rowフォーマットで表現された最大値の行です (extremes が 1 に設定されている場合) 。rowsは、出力行の総数です。rows_before_limitは、LIMIT がなかった場合に存在していたであろう行数の下限値です。LIMIT を含むクエリでのみ出力されます。クエリに GROUP BY が含まれている場合、rows_before_limit_at_least は LIMIT がなかった場合に存在していた行数の正確な値になります。timeは、リクエストの実行時間 (秒) です。rows_readは、読み取られた行数です。bytes_readは、読み取られた (非圧縮の) バイト数です。
data、totals、min、max の各プレースホルダーには、エスケープ規則を指定してはいけません (または明示的に None を指定する必要があります) 。残りのプレースホルダーには任意のエスケープ規則を指定できます。
format_template_resultset 設定が空文字列の場合、デフォルト値として ${data} が使用されます。
INSERT クエリ用のフォーマットでは、プレフィックスまたは接尾辞によって一部のカラムまたはフィールドをスキップできます (例を参照) 。
インライン指定
クラスター内のすべてのノード上のディレクトリに、テンプレートフォーマットの設定 (format_template_row、format_template_resultset で設定) をデプロイすることが困難、あるいは不可能な場合がよくあります。
さらに、そのフォーマットが非常に単純で、ファイルとして配置する必要がない場合もあります。
このような場合には、format_template_row_format (format_template_row 用) および format_template_resultset_format (format_template_resultset 用) を使用して、ファイルへのパスではなく、テンプレート文字列そのものをクエリ内で直接指定できます。
フォーマット文字列およびエスケープシーケンスに関するルールは、次と同じです。
format_template_row_formatを使用する場合はformat_template_row。format_template_resultset_formatを使用する場合はformat_template_resultset。
使用例
まずは Template 形式の利用例として、データの選択と挿入の 2 つのケースを見ていきます。
データの選択
データの挿入
プレースホルダー内の PageViews、UserID、Duration および Sign は、テーブル内の列名です。行中の Useless field 以降の値と、接尾辞中の \nTotal rows: 以降の値は無視されます。
入力データ内のすべての区切り文字は、指定されたフォーマット文字列内の区切り文字と厳密に一致している必要があります。
インライン指定
Markdown テーブルを手作業で整形するのにうんざりしていませんか?この例では、Template フォーマットとインライン指定の設定を使って、単純なタスク、つまり system.formats テーブルからいくつかの ClickHouse フォーマット名を SELECT し、それらを Markdown テーブルとして整形する方法を見ていきます。これは、Template フォーマットと format_template_row_format および format_template_resultset_format 設定を使えば簡単に実現できます。
前の例では、結果セットおよび行フォーマットの文字列を別ファイルに記述し、それらファイルへのパスをそれぞれ format_template_resultset および format_template_row 設定で指定しました。ここではテンプレートがごく単純で、Markdown テーブルを作るためのいくつかの | と - だけで構成されるため、インラインで指定します。結果セットのテンプレート文字列は、format_template_resultset_format 設定を使って指定します。テーブルヘッダを作るために、${data} の前に |ClickHouse Formats|\n|---|\n を追加しています。行に対しては、format_template_row_format 設定を使用し、テンプレート文字列 |`{0:XML}`| を指定します。Template フォーマットは、指定したフォーマットで整形した行をプレースホルダー ${data} に挿入します。この例ではカラムは 1 つだけですが、もし追加したい場合は、行テンプレート文字列に {1:XML}、{2:XML} ... のように追記し、適切なエスケープルールを選択すればかまいません。この例ではエスケープルールとして XML を使用しています。
ご覧のとおり、あの markdown テーブルを作るために必要な | や - を、手作業で一つずつ追加していく手間を省くことができました: