メインコンテンツまでスキップ
メインコンテンツまでスキップ

Npy

InputOutputAlias

説明

Npy 形式は、.npy ファイルから NumPy 配列を ClickHouse にロードするために設計されています。 NumPy ファイル形式は、数値データの配列を効率的に保存するために使用されるバイナリ形式です。 インポート中、ClickHouse は最上位次元を単一カラムの行の配列として扱います。

以下の表は、サポートされている Npy データ型とそれに対応する ClickHouse の型を示しています。

データ型の対応

Npy データ型 (INSERT)ClickHouse データ型Npy データ型 (SELECT)
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

使用例

Python を使って .npy 形式で配列を保存する

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

ClickHouse で NumPy ファイルを読み込む

SELECT *
FROM file('example_array.npy', Npy)
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

データの選択

ClickHouse のテーブルからデータを選択し、clickhouse-client を使用して Npy 形式のファイルに保存することができます。

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

形式設定