メインコンテンツへスキップ
メインコンテンツへスキップ

sparkbar

この関数は、値 x と、その値の出現回数(頻度)を表す y に対して、区間 [min_x, max_x] 上で度数ヒストグラムをプロットします。 同じバケットに入るすべての x の出現回数(頻度)y は平均化されるため、データは事前に集約されている必要があります。 y の負の値は無視されます。

区間が指定されていない場合、最小の x が区間の開始として、最大の x が区間の終了として使用されます。 区間が指定されている場合は、その区間外の値は無視されます。

構文

sparkbar(buckets[, min_x, max_x])(x, y)

パラメータ

  • buckets — セグメント数。型: Integer
  • min_x — 区間の開始値。省略可能なパラメータ。
  • max_x — 区間の終了値。省略可能なパラメータ。

引数

  • x — 値を持つフィールド。
  • y — 値の頻度を示すフィールド。

返される値

  • 度数ヒストグラム。

クエリ:

CREATE TABLE spark_bar_data (`value` Int64, `event_date` Date) ENGINE = MergeTree ORDER BY event_date;

INSERT INTO spark_bar_data VALUES (1,'2020-01-01'), (3,'2020-01-02'), (4,'2020-01-02'), (-3,'2020-01-02'), (5,'2020-01-03'), (2,'2020-01-04'), (3,'2020-01-05'), (7,'2020-01-06'), (6,'2020-01-07'), (8,'2020-01-08'), (2,'2020-01-11');

SELECT sparkbar(9)(event_date,cnt) FROM (SELECT sum(value) as cnt, event_date FROM spark_bar_data GROUP BY event_date);

SELECT sparkbar(9, toDate('2020-01-01'), toDate('2020-01-10'))(event_date,cnt) FROM (SELECT sum(value) as cnt, event_date FROM spark_bar_data GROUP BY event_date);

結果:

┌─sparkbar(9)(event_date, cnt)─┐
│ ▂▅▂▃▆█  ▂                    │
└──────────────────────────────┘

┌─sparkbar(9, toDate('2020-01-01'), toDate('2020-01-10'))(event_date, cnt)─┐
│ ▂▅▂▃▇▆█                                                                  │
└──────────────────────────────────────────────────────────────────────────┘

この関数の別名(エイリアス)は sparkBar です。