メインコンテンツまでスキップ
メインコンテンツまでスキップ

cramersV

Cramer's V(時々Cramer's phiと呼ばれる)は、テーブル内の二つのカラム間の関連性を測定する指標です。cramersV関数の結果は、変数間に関連がない場合に相当する0から1までの範囲で、各値が互いに完全に決定される場合にのみ1に達することができます。この指標は、二つの変数間の関連性をその最大可能変動の割合として見ることができます。

注記

バイアス修正されたCramer's Vのバージョンについては、cramersVBiasCorrectedを参照してください。

構文

cramersV(column1, column2)

パラメータ

  • column1: 比較する最初のカラム。
  • column2: 比較する二番目のカラム。

返される値

  • カラムの値間に関連がない場合に相当する0から(完全な関連)1までの値。

タイプ: いつも Float64

以下の二つのカラムは互いに関連がないため、cramersVの結果は0です:

クエリ:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

結果:

┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

以下の二つのカラムはかなり密接に関連しているため、cramersVの結果は高い値になります:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

結果:

┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘