メインコンテンツへスキップ
メインコンテンツへスキップ

varSamp

varSamp

Introduced in: v1.1.0

データセットの標本分散を計算します。

標本分散は次の式を使用して計算されます:

Σ(xxˉ)2n1\frac{\Sigma{(x - \bar{x})^2}}{n-1}

ここで:

  • xx はデータセット内の各データポイント
  • xˉ\bar{x} はデータセットの算術平均
  • nn はデータセット内のデータポイントの数

この関数は、入力データセットがより大きな母集団からの標本であることを前提としています。母集団全体の分散を計算する場合(完全なデータセットがある場合)は、代わりにvarPopを使用してください。

注記

この関数は数値的に不安定なアルゴリズムを使用しています。計算に数値安定性が必要な場合は、varSampStable関数を使用してください。処理は遅くなりますが、計算誤差が小さくなります。

構文

varSamp(x)

エイリアス: VAR_SAMP

引数

戻り値

入力データセット x の標本分散を返します。Float64

標本分散の計算

DROP TABLE IF EXISTS test_data;
CREATE TABLE test_data
(
    x Float64
)
ENGINE = Memory;

INSERT INTO test_data VALUES (10.5), (12.3), (9.8), (11.2), (10.7);

SELECT round(varSamp(x),3) AS var_samp FROM test_data;
┌─var_samp─┐
│    0.865 │
└──────────┘