Перейти к основному содержанию
Перейти к основному содержанию

theilsU

Функция theilsU вычисляет коэффициент неопределённости U Тейла — величину, которая измеряет степень ассоциации между двумя столбцами в таблице. Её значения лежат в диапазоне от −1.0 (100% отрицательная ассоциация, или идеальная инверсия) до +1.0 (100% положительная ассоциация, или идеальное совпадение). Значение 0.0 указывает на отсутствие ассоциации.

Синтаксис

theilsU(column1, column2)

Аргументы

  • column1 и column2 — столбцы, которые сравниваются

Возвращаемое значение

  • значение в диапазоне от -1 до 1

Тип возвращаемого значения всегда Float64.

Пример

Два столбца, сравниваемые ниже, имеют слабую взаимосвязь друг с другом, поэтому значение theilsU отрицательное:

SELECT
    theilsU(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 4 AS b
        FROM
            numbers(150)
    );

Результат:

┌────────theilsU(a, b)─┐
│ -0.30195720557678846 │
└──────────────────────┘