対応のあるt検定

対応のあるt検定 (paired t-test) とはパラメトリック検定のひとつである。得られたデータの各観測値がペアとして対応している対標本における各観測値の差の検定である。スチューデントのt検定ウェルチのt検定とは別物であるが、実際には、対応のあるt検定で求める統計量もスチューデントのtであり、本検定をスチューデントのt検定と呼んでも間違いではない。しかし一般には、対応のない2標本の平均値の差の検定をスチューデントのt検定、対応のある対標本の差の検定を対応のあるt検定という。

データ間の対応の有無とは、例えば以下のようなものである。ある学年のあるクラスで実施した数学のテスト結果をデータAとする。そのクラスに対し数学のドリルによる計算練習を一定期間与えた後に再度、同程度のレベルの数学のテストを受けさせ、得られたテスト結果をデータBとする。このデータAおよびデータBには"対応がある"。一方で、ある学年の別のクラスで実施した数学のテスト結果をデータCとする。このデータCとデータAには"対応がない"。2つのデータがペアとして対応している対標本から得られた場合を"対応がある"といい、別々の標本から得られた場合を"対応がない"という。

2つのデータ間に対応がなく、また、データの分布に正規性が仮定できるとき、対応のあるt検定を行う。サンプルサイズがともにNのデータXおよびYの差の比較は以下のように行う。

データXX1, X2, X3, ..., XN
データYY1, Y2, Y3, ..., YN

まず、データXおよびYの差dN (= XN - YN) を求める。

データの差d1, d2, d3, ..., dN

次に、以下の統計量Tを求める。ここで、dはデータの差の平均、μdはデータの差の母平均、Udはデータの差の不偏標準偏差である。

\begin{eqnarray*}T=\frac{\overline{d}-\mu_d}{U_d / \sqrt{N}}\end{eqnarray*}

以上で与えられる統計量Tは自由度 N-1 のt分布に従う値である。ここで、検定の帰無仮説 (H0) を立てる。帰無仮説 (H0) は2群のデータに差がないこと、すなわち "μd=0であること" である。そこで、μd=0 を上の式に代入し、以下のTを得る。

T=\frac{\overline{d}}{U_d / \sqrt{N}}

この統計量Tが、自由度 N-1 のt分布上にてあらかじめ設定した棄却域に入るか否かを考える。つまり、対応のあるt検定とはデータの差の1標本のt検定のことである。以上が対応のあるt検定であるが、実際の活用にはRを用いた計算が簡単である。

このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る