メインコンテンツまでスキップ
メインコンテンツまでスキップ

kolmogorovSmirnovTest

二つの母集団からのサンプルに対して、コルモゴロフ-スミルノフ検定を適用します。

構文

両方のサンプルの値は sample_data カラムにあります。sample_index が 0 の場合、その行の値は最初の母集団からのサンプルに属します。それ以外の場合は、第二の母集団からのサンプルに属します。 サンプルは連続的な一次元の確率分布に属する必要があります。

引数

パラメータ

  • alternative — 対立仮説。 (オプション、デフォルト: 'two-sided'.) 文字列。 F(x) と G(x) をそれぞれ最初の分布と第二の分布のCDFとします。
    • 'two-sided' 帰無仮説はサンプルが同一の分布から来ているというもので、すなわち全ての x に対して F(x) = G(x) です。 対立仮説は分布が同一でないということです。
    • 'greater' 帰無仮説は最初のサンプルの値が第二のサンプルの値よりも確率的に小さいというもので、 すなわち最初の分布のCDFが第二の分布のCDFの上にあり、したがって左側に位置します。 これは実際には全ての x に対して F(x) >= G(x) という意味です。この場合の対立仮説は F(x) < G(x) で、少なくとも一つの x に対して成り立ちます。
    • 'less'。 帰無仮説は最初のサンプルの値が第二のサンプルの値よりも確率的に大きいというもので、 すなわち最初の分布のCDFが第二の分布のCDFの下にあり、したがって右側に位置します。 これは実際には全ての x に対して F(x) <= G(x) という意味です。この場合の対立仮説は F(x) > G(x) で、少なくとも一つの x に対して成り立ちます。
  • computation_method — p値を計算するために使用される方法。 (オプション、デフォルト: 'auto'.) 文字列
    • 'exact' - 計算は検定統計量の正確な確率分布を使用して行います。小さなサンプル以外では計算負荷が高く無駄が多いです。
    • 'asymp' ('asymptotic') - 計算は近似を使用して行います。大きなサンプルサイズの場合、正確なp値と漸近的p値は非常に似ています。
    • 'auto' - サンプルの最大数が 10'000 未満の場合に、'exact' 方法が使用されます。

返される値

タプルで二つの要素を持ちます:

  • 計算された統計量。 Float64
  • 計算されたp値。 Float64

クエリ:

結果:

注: p値は 0.05 より大きい(信頼水準95%の場合)ため、帰無仮説は棄却されません。

クエリ:

結果:

注: p値は 0.05 より小さい(信頼水準95%の場合)ため、帰無仮説は棄却されます。

関連情報