メインコンテンツへスキップ
メインコンテンツへスキップ

cramersV

cramersV

導入バージョン: v22.1.0

Cramer's V (Cramer's phi と呼ばれることもあります) は、テーブルの 2 つのカラム間の関連性の強さを表す指標です。 cramersV 関数の結果は 0 (変数間に関連性がないことに対応) から 1 の範囲を取り、一方の値が他方によって完全に決定される場合にのみ 1 になります。 これは、2 つの変数間の関連性を、それらが取り得る最大限の変動量に対する割合として解釈できます。

注記

バイアス補正済みの Cramer's V については、cramersVBiasCorrected を参照してください。

構文

cramersV(column1, column2)

引数

  • column1 — 比較対象となる 1 つ目のカラム。(U)Int* または Float* または Decimal
  • column2 — 比較対象となる 2 つ目のカラム。(U)Int* または Float* または Decimal

返される値

カラムの値の間に関連性がないことを表す 0 から、完全な関連性があることを表す 1 までの値を返します。Float64

カラム間に関連性がない場合

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );
┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

カラム間の関連性が強い場合

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            if (number % 12 = 0, (number + 1) % 5, number % 5) AS b
        FROM
            numbers(150)
    );
┌─────cramersV(a, b)─┐
│ 0.9066801892162646 │
└────────────────────┘