集約関数
ClickHouseはすべての標準SQL集約関数(sum、avg、min、max、count)および幅広いその他の集約関数をサポートしています。
ページ | 説明 |
---|---|
aggThrow | この関数は例外安全性をテストするために使用できます。指定された確率で作成時に例外をスローします。 |
analysisOfVariance | 一方向の分散分析(ANOVAテスト)のための統計テストを提供します。これは、すべてのグループが同じ平均を持つかどうかを確認するために、正規分布した観察のいくつかのグループに対するテストです。 |
any | カラムの最初に遭遇した値を選択します。 |
anyHeavy | ヘビーヒッターアルゴリズムを使用して頻繁に出現する値を選択します。クエリ実行スレッドごとに半分以上のケースで発生する値があれば、その値が返されます。通常、結果は非決定的です。 |
anyLast | カラムの最後に遭遇した値を選択します。 |
approx_top_k | 指定されたカラムにおいて、約最も頻繁に出現する値とそのカウントの配列を返します。 |
approx_top_sum | 指定されたカラムにおいて、約最も頻繁に出現する値とそのカウントの配列を返します。 |
argMax | 最大のval 値に対するarg の値を計算します。 |
argMin | 最小のval 値に対するarg の値を計算します。最大が同じval を持つ複数の行がある場合、どちらの関連するarg が返されるかは非決定的です。 |
groupArrayArray | 配列を大きな配列に集約します。 |
avg | 算術平均を計算します。 |
avgWeighted | 重み付き算術平均を計算します。 |
boundingRatio | 値のグループ間の左端と右端のポイントの間の傾きを計算する集約関数です。 |
categoricalInformationValue | 各カテゴリに対して(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0))) の値を計算します。 |
contingency | contingency 関数は、テーブル内の二つのカラム間の関連性を測定する値であるコンティンジェンシー係数を計算します。計算はcramersV 関数に似ていますが、平方根内の分母が異なります。 |
corr | ピアソンの相関係数を計算します。 |
corrMatrix | N変数の相関行列を計算します。 |
corrStable | ピアソンの相関係数を計算しますが、数値的に安定したアルゴリズムを使用します。 |
count | 行またはNULLでない値の数をカウントします。 |
covarPop | 母集団の共分散を計算します。 |
covarPopMatrix | N変数に対する母集団共分散行列を返します。 |
covarPopStable | 母集団共分散の値を計算します。 |
covarSamp | Σ((x - x̅)(y - y̅)) / (n - 1) の値を計算します。 |
covarSampMatrix | N変数に対するサンプル共分散行列を返します。 |
covarSampStable | covarSampに似ていますが、低計算誤差を提供しながら遅く動作します。 |
cramersV | cramersV 関数の結果は、変数間に関連がない場合は0から、完全に他方から決定される場合は1までの範囲です。これは二つの変数における関連を最大可能変化の割合として見ることができます。 |
cramersVBiasCorrected | Cramer's Vを計算しますが、バイアス修正を使用します。 |
deltaSum | 連続行間の算術差の合計を計算します。 |
deltaSumTimestamp | 連続行間の差を加算します。差が負の場合は無視されます。 |
entropy | 値のカラムに対するシャノンエントロピーを計算します。 |
estimateCompressionRatio | 列を圧縮せずに圧縮比を推定します。 |
exponentialMovingAverage | 定められた時間における値の指数移動平均を計算します。 |
exponentialTimeDecayedAvg | 時間t における時系列の指数平滑化された重み付き移動平均を返します。 |
exponentialTimeDecayedCount | 指数的減衰を時間系列にわたって返します。 |
exponentialTimeDecayedMax | 時間t における指数平滑化された最大値をt-1 の最大値と比較して返します。 |
exponentialTimeDecayedSum | 時間t における時系列の指数平滑化された移動平均値の合計を返します。 |
first_value | anyのエイリアスですが、ウィンドウ関数との互換性のために導入されました。時にはNULL 値を処理する必要があります(デフォルトではすべてのClickHouse集約関数はNULL値を無視します)。 |
flameGraph | スタックトレースのリストを使用してフレームグラフを構築する集約関数です。 |
groupArray | 引数値の配列を作成します。値は任意の(非決定的な)順序で配列に追加できます。 |
groupArrayInsertAt | 指定した位置に値を配列に挿入します。 |
groupArrayIntersect | 与えられた配列の交差を返します(すべての与えられた配列に存在するアイテムを返します)。 |
groupArrayLast | 最後の引数値の配列を作成します。 |
groupArrayMovingSum | 入力値の移動合計を計算します。 |
groupArrayMovingAvg | 入力値の移動平均を計算します。 |
groupArraySample | サンプル引数値の配列を作成します。生成された配列のサイズはmax_size 要素に制限されます。引数値はランダムに選択され、配列に追加されます。 |
timeSeriesGroupArray | 時系列をタイムスタンプで昇順にソートします。 |
groupArraySorted | 最初のNアイテムが昇順で並べられた配列を返します。 |
groupBitAnd | 数字の系列にビット単位のAND を適用します。 |
groupBitmap | 符号なし整数カラムからビットマップまたは集約計算を行い、戻り値の型はUInt64の基数です。サフィックス-Stateを追加すると、ビットマップオブジェクトが返されます。 |
groupBitmapAnd | ビットマップカラムのANDを計算し、戻り値の型はUInt64の基数です。サフィックス-Stateを追加すると、ビットマップオブジェクトが返されます。 |
groupBitmapOr | ビットマップカラムのORを計算し、戻り値の型はUInt64の基数です。サフィックス-Stateを追加すると、ビットマップオブジェクトが返されます。これはgroupBitmapMerge と同等です。 |
groupBitmapXor | ビットマップカラムのXORを計算し、UInt64の基数を返します。-Stateサフィックスを使用するとビットマップオブジェクトが返されます。 |
groupBitOr | 数字の系列にビット単位のOR を適用します。 |
groupBitXor | 数字の系列にビット単位のXOR を適用します。 |
groupUniqArray | 異なる引数値から配列を作成します。 |
intervalLengthSum | 数値軸上のすべての範囲の合併の総長を計算します。 |
kolmogorovSmirnovTest | 二つの母集団からのサンプルにKolmogorov-Smirnovのテストを適用します。 |
kurtPop | 数列の尖度を計算します。 |
kurtSamp | 数列のサンプル尖度を計算します。 |
largestTriangleThreeBuckets | 入力データに対してLargest-Triangle-Three-Bucketsアルゴリズムを適用します。 |
last_value | anyLast に似ていますが、NULLを受け入れることができる最後の遭遇した値を選択します。 |
mannWhitneyUTest | 二つの母集団からのサンプルにMann-Whitneyランクテストを適用します。 |
max | 値のグループ間の最大値を計算する集約関数です。 |
maxIntersections | 値のグループ間で相互に交差する最大の回数を計算する集約関数です(すべての範囲が少なくとも一度交差する場合)。 |
maxIntersectionsPosition | maxIntersections関数の出現位置を計算する集約関数です。 |
maxMap | key 配列で指定されたキーに基づいてvalue 配列から最大値を計算します。 |
meanZTest | 二つの母集団のサンプルに対して平均Zテストを適用します。 |
median | median* 関数は対応するquantile* 関数のエイリアスです。数値データサンプルの中央値を計算します。 |
min | 値のグループ間の最小値を計算する集約関数です。 |
minMap | key 配列で指定されたキーに基づいてvalue 配列から最小値を計算します。 |
quantile | 数値データの列の近似分位点を計算します。 |
quantileDD | 相対誤差保証のあるサンプルの近似分位点を計算します。 |
quantileBFloat16 | bfloat16数からなるサンプルの近似分位点を計算します。 |
quantileDeterministic | 数値データの列の近似分位点を計算します。 |
quantileExact Functions | quantileExact、quantileExactLow、quantileExactHigh、quantileExactExclusive、quantileExactInclusive関数 |
quantileExactWeighted | 各要素の重みを考慮して、数値データの列の分位点を正確に計算します。 |
quantileGK | Greenwald-Khannaアルゴリズムを使用して数値データの列の分位点を計算します。 |
quantileExactWeightedInterpolated | 各要素の重みを考慮し、線形補間を使用して数値データの列の分位点を計算します。 |
quantileInterpolatedWeighted | 各要素の重みを考慮し、線形補間を使用して数値データの列の分位点を計算します。 |
quantiles Functions | quantiles、quantilesExactExclusive、quantilesExactInclusive、quantilesGK |
quantileTDigest | t-digestアルゴリズムを使用して数値データ列の近似分位点を計算します。 |
quantileTDigestWeighted | t-digestアルゴリズムを使用して数値データ列の近似分位点を計算します。 |
quantileTiming | 定められた精度で、数値データ列の分位点を計算します。 |
quantileTimingWeighted | 定められた精度で、各列メンバーの重みを考慮して数値データ列の分位点を計算します。 |
rankCorr | ランク相関係数を計算します。 |
simpleLinearRegression | 単純(一次元)線形回帰を実行します。 |
singleValueOrNull | 集約関数singleValueOrNull は、x = ALL (SELECT ...) のようなサブクエリ演算子を実装するために使用されます。データ内にユニークな非NULL値が一つだけ存在するかをチェックします。 |
skewPop | 数列の歪度を計算します。 |
skewSamp | 数列のサンプル歪度を計算します。 |
sparkbar | 関数は値x とこれらの値の頻度y のヒストグラムを[min_x, max_x] の間隔でプロットします。 |
stddevPop | 結果はvarPopの平方根と等しいです。 |
stddevPopStable | 結果はvarPopの平方根と等しいです。stddevPopとは異なり、この関数は数値的に安定したアルゴリズムを使用します。 |
stddevSamp | 結果はvarSampの平方根と等しいです。 |
stddevSampStable | 結果はvarSampの平方根と等しいです。この関数は数値的に安定したアルゴリズムを使用します。 |
stochasticLinearRegression | この関数は確率的線形回帰を実装します。学習率、L2正則化係数、ミニバッチサイズのカスタムパラメータをサポートし、重みを更新するためのいくつかの方法(Adam、単純なSGD、モメンタム、ネステロフ)があります。 |
stochasticLogisticRegression | この関数は確率的ロジスティック回帰を実装します。バイナリ分類問題に使用でき、stochasticLinearRegressionと同様のカスタムパラメータをサポートし、同じ方法で動作します。 |
studentTTest | 二つの母集団からのサンプルにStudentのt検定を適用します。 |
sum | 合計を計算します。数値にのみ機能します。 |
studentTTestOneSample | 一標本Studentのt検定をサンプルと既知の母集団平均に適用します。 |
sumCount | 数値の合計を計算し、同時に行の数をカウントします。この関数はClickHouseクエリオプティマイザーによって使用されます:クエリ内に複数のsum 、count またはavg 関数がある場合、それらは計算を再利用するために単一のsumCount 関数に置き換えられます。この関数は明示的に使用する必要はほとんどありません。 |
sumKahan | Kahan補正合計アルゴリズムを使用して数値の合計を計算します。 |
sumMap | 指定されたキーレファレンスに基づいて一つまたはそれ以上のvalue 配列を合計します。キーはソートされた順序で、対応するキーに対して合計された値のタプルを返します。 |
sumMapWithOverflow | 指定されたキーレファレンスに基づいてvalue 配列を合計します。二つの配列のタプルを返します:キーがソート順で、対応するキーの値が合計されます。sumMap関数とは異なり、溢れを伴う合計を実行します。 |
sumWithOverflow | 数値の合計を計算します。結果のデータ型は入力パラメータと同じです。このデータ型の最大値を超えた場合は、溢れを伴う計算が行われます。 |
theilsU | theilsU 関数はTheils' U不確実性係数を計算し、テーブル内の二つのカラム間の関係を測定する値です。 |
topK | 指定されたカラムにおいて、約最も頻繁に出現する値の配列を返します。結果の配列は、値自身ではなく、近似頻度の降順にソートされます。 |
topKWeighted | 指定されたカラムにおいて、約最も頻繁に出現する値の配列を返します。結果の配列は、値自身ではなく、近似頻度の降順にソートされ、値の重みも考慮されます。 |
uniq | 引数の異なる値の近似数を計算します。 |
uniqCombined | 異なる引数値の近似数を計算します。 |
uniqCombined64 | 異なる引数値の近似数を計算します。uniqCombinedと同じですが、Stringデータ型だけでなくすべてのデータ型に対して64ビットハッシュを使用します。 |
uniqExact | 異なる引数値の正確な数を計算します。 |
uniqHLL12 | HyperLogLogアルゴリズムを使用して、異なる引数値の近似数を計算します。 |
uniqTheta | Theta Sketchフレームワークを使用して、異なる引数値の近似数を計算します。 |
varPop | 母集団の分散を計算します。 |
varPopStable | 母集団の分散を返します。varPopとは異なり、この関数は数値的に安定したアルゴリズムを使用します。遅く動作しますが、計算誤差が低くなります。 |
varSamp | データセットのサンプル分散を計算します。 |
varSampStable | データセットのサンプル分散を計算します。varSamp とは異なり、この関数は数値的に安定したアルゴリズムを使用します。遅く動作しますが、計算誤差が低くなります。 |
welchTTest | 二つの母集団からのサンプルにWelchのt検定を適用します。 |
distinctDynamicTypes | 動的カラムに格納されている異なるデータ型のリストを計算します。 |
distinctJSONPaths | JSONカラムに格納されている異なるパスのリストを計算します。 |
timeSeriesDeltaToGrid | 指定されたグリッド上の時系列データに対してPromQLに似たデルタを計算する集約関数です。 |
timeSeriesInstantDeltaToGrid | 指定されたグリッド上の時系列データに対してPromQLに似た即時デルタを計算する集約関数です。 |
timeSeriesInstantRateToGrid | 指定されたグリッド上の時系列データに対してPromQLに似た即時レートを計算する集約関数です。 |
timeSeriesLastTwoSamples | PromQLに似た即時レートおよびデルタ計算のために時系列データを再サンプリングする集約関数です。 |
timeSeriesRateToGrid | 指定されたグリッド上の時系列データに対してPromQLに似たレートを計算する集約関数です。 |
timeSeriesResampleToGridWithStaleness | 指定されたグリッドのために時系列データを再サンプリングする集約関数です。 |
timeSeriesDerivToGrid | 指定されたグリッド上の時系列データに対してPromQLに似た導関数を計算する集約関数です。 |
timeSeriesPredictLinearToGrid | 指定されたグリッド上の時系列データに対してPromQLに似た線形予測を計算する集約関数です。 |
timeSeriesChangesToGrid | 指定されたグリッド上の時系列データに対してPromQLに似た変化を計算する集約関数です。 |
timeSeriesResetsToGrid | 指定されたグリッド上の時系列データに対してPromQLに似たリセットを計算する集約関数です。 |
groupConcat | 一連の文字列から連結された文字列を計算し、デリミタで区切ってオプションで要素数に制限を設けます。 |
quantilePrometheusHistogram | 線形補間を使用してヒストグラムの分位点を計算します。 |