Dec. 18, 2005 作成 

独立した多群の差の検定(柳井久江Statcelの利用)

 一つの要因に注目して三つ以上の異なる集団(一元配置データ)の平均値または中央値を使って,それらの母集団に差があるかどうかの検定をする機会は多い。次に柳井Statcelに従って,二つの方法を紹介する。
 このすぐ下にある「一元配置の分散分析」が通常実施されるが,
データ分布に正規性を仮定せずしかも離散データでも分析が可能なクラスカル・ワーリス検定もある。

一元配置の分散分析 One-factor ANOVA  analysis of variance

 とくに,各集団のデータが正規分布をしていて,その分散が等しいと考えられる場合,一元配置の分散分析法が用いられる。
 検定の順番は次のようになる。
1. 各集団の正規性を検定する。
2. バートレット検定 Bartlett test法をつかって各集団の母分散が正しいかどうかを検定する。
3. 一元配置の分散分析を実施する。

 例19を利用する。
1. まずは3群の正規性を検定する。P値が0.05より多ければクリアされたことになる。この例ではクリアした。

2. 3群の等分散性を検定するのであるが,
 帰無仮説:3群の分散は均一と見なせる
 対立仮説:3群の分散は均一と見なせない(上側検定)
データの形式を列挙データとする。つまり,3列のタイトル行の下に数値を並べる。
 1) メニューバーの統計からバートレット検定を選択する。
 2) ダイアログが現れるので必要な設定してOKをする。データフォームは列挙,条件は上側,危険率5%。
 3) 指定した出力範囲に,計算結果が表示される。
 4) 境界値による判定では開自乗値がχ2(0.95)値以上のとき,帰無仮説は棄却される。P値による判定ではP値が目的とする危険率以下の帰無仮説は棄却される。この例ではいずれも棄却されないから,「3群の分散は均一とみなせる」。

3. 一元配置分散分析
 この手法は独立した3群以上の集合の分散が等しいとみなせる場合(母分散は未知),平均値(母平均)がすべて等しいかどうかを検定する。帰無仮説:ある要因の水準間に差はない,を検定することになる。
 考え方:全体のばらつき(全変動)は,要因による変動と誤差変動の和である。要因変動が誤差変動より大きいかどうかで要因の検定をすることができる。計算の結果,分散分析表が出力される。バートレット検定と同様,データの形式を列挙データとする。つまり,3列のタイトル行の下に数値を並べる。
 1) メニューバーの統計から分散分析を選択。そのうちの一元配置分散分析を選択する。
 2) ダイアログが現れるので必要な設定してOKをする。データフォームは列挙,条件は上側,危険率5%。
 3) 指定した出力範囲に,計算結果が表示される。
 4) 出力された分散分析表を使う。境界値による判定ではF値がF(0.95)値以上のとき,帰無仮説は棄却される。P値による判定ではP値が目的とする危険率以下の帰無仮説は棄却される。この例ではいずれも棄却されるから,「3群には差がある」となる。

クラスカル・ワーリス検定 Kruskal-Wallis test

 データ分布の正規性を仮定しない利点がある。3群以上の母集団分布の平均が等しいという仮説の検定に使用する。必要なデータ数は各群ともに3以上である。データフォームはここでは列挙データとする。例題21を使用する。この例題21はある薬についての,3種類のラットの薬物効果を5段階評価しているので,離散データである。
 帰無仮説:「ラットの種類が異なっていても薬物の効果に差はない」
 対立仮説:「異なる種類のラットでは薬物高価に違いがある」

 1) メニューバーの統計からノンパラメトリック検定を選択し,さらにクラスカル・ワーリス検定を選択する。
 2) 現れたダイアログボックスにたいして,データフォームは列挙データ,条件として上側,5%を選ぶ。
 3) 指定した出力範囲に,計算結果が表示される。
 4) 群数が3でデータ数が17以下のときは,「検定の結果」の同順位補正H値を使って判定する。データがより多い時はH値を利用できる。いずれにしろH値(または同順位補正H値)がH値の有意点の上側境界値(p<0.05または<0.01)よりも大きい時には,棄却域に入り,帰無仮説は棄却される。この例の場合は,帰無仮説は棄却されるので,対立仮説が採用される。