t検定の繰り返しについて

A, BおよびCの3群以上のサンプルデータがあるとき、これらの統計検定つまり、A-B間、B-C間およびC-A間の統計検定にt検定を用いることはできない。

これらの3組の検定を2群間における3回のt検定で行ったと仮定した場合、「少なくともひとつの組み合わせに差が出る確率」「1 - すべての組み合わせで差が出ない確率」つまり「1 - (A-B間で差が出ない確率) * (B-C間で差が出ない確率) * (C-A間で差が出ない確率)」で与えられるが、この値は各サンプルデータ間で差が出る確率より大きな数になる。例えば、各サンプルデータ間で差が出る確率を0.01とした場合、上の値は「1 - (1 - 0.01) * (1 - 0.01) * (1 - 0.01)」より0.029701となる。これは、各サンプルデータ間で差が出る確率として設定した0.01より遥かに大きい数値である。

一般に、αを群間で差が出る確率とおいたとき、「少なくともひとつの組み合わせに差が出る確率」は上と同様の方法で「1 - (1 - α)nとあらわされるが、この値をαが0.01のときと0.05のときでn=3からn=10まで計算した値が以下の表である。以下に示されるように、群間で差が出る確率がたとえ5%であったとしても検定を10回繰り返すと少なくともそれらの組み合わせて差が出る確率は約40%に達する。

nα= 0.01α= 0.05
30.02970.1426
40.03940.1855
50.04900.2262
60.05850.2649
70.06790.3017
80.07720.3366
90.08650.3698
100.09560.4013

このように、t検定を繰り返すと差が出る確率が大きくなってしまうため、3群以上のサンプルデータ群においてはt検定を用いることはできない。3群以上の統計検定にはダネット法やボンフェローニ法などの多重比較法を用いる。

このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る