跳到主要内容
跳到主要内容

cramersVBiasCorrected

Cramer's V 是衡量表中两个列之间关联性的度量。cramersV 函数的结果范围从 0(表示变量之间没有关联)到 1,只有当每个值完全被另一个值决定时才能达到 1。该函数可能存在严重偏差,因此这个版本的 Cramer's V 使用了 偏差修正

语法

cramersVBiasCorrected(column1, column2)

参数

  • column1: 第一个要比较的列。
  • column2: 第二个要比较的列。

返回值

  • 一个介于 0(表示列值之间没有关联)到 1(完全关联)之间的值。

类型:始终为 Float64

示例

以下比较的两个列之间的关联性较小。注意 cramersVBiasCorrected 的结果小于 cramersV 的结果:

查询:

SELECT
    cramersV(a, b),
    cramersVBiasCorrected(a ,b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 4 AS b
        FROM
            numbers(150)
    );

结果:

┌──────cramersV(a, b)─┬─cramersVBiasCorrected(a, b)─┐
│ 0.41171788506213564 │         0.33369281784141364 │
└─────────────────────┴─────────────────────────────┘