ルビーン検定

Rにてルビーン検定 (Levene test) を行う。日本語表記では、ルベーン検定とかレーベン検定とされる場合もある。ルビーン検定は得られた複数群のデータ間に等分散性、分散の一様性が仮定できるかどうかを検定する手法である。アメリカの統計学者、Howard Leveneによって開発された。等分散性の検定には、バートレット検定ハートレイ検定等があるが、ルビーン検定はこれらの検定法と比較し、得られたデータが正規分布に従わないことが想定される場合にも頑健な結果を返すとされており、そのような場合には他の検定法よりルビーン検定を使用するのが好ましい。Rにおいては、'car' パッケージの関数 'leveneTest' にて実行することができる。パッケージ 'car' には、その他にも 'levene.test' という関数が用意されているが、こちらはサポートが終了しているため、やはり'leveneTest' を用いることが推奨される。

まず、Rを起動させ、以下のコマンドにてパッケージをインストールし、そのパッケージを読み込む。既にインストール済みの場合、1行目のコマンドは不要。

1|$install.packages("car", repos="http://cran.ism.ac.jp/")
2|$library(car)

以下の、サンプルサイズがそれぞれ、'9, 10, 8, 8' からなるデータAからDが得られたときの各データ間における分散が等しいか否かをルビーン検定にて解析する。帰無仮説 (H0) は各群の母分散は全て等しいことである。

データA301, 311, 325, 291, 388, 412, 325, 361, 287
データB197, 180, 247, 260, 247, 199, 179, 134, 163, 200
データC209, 302, 187, 166, 234, 290, 175, 116
データD342, 216, 316, 386, 324, 145, 254, 228

まず、以下のコマンドにて、上のデータAからDをまとめて変数 'score' に格納する。

1|$score=c(301, 311, 325, 291, 388, 412, 325, 361, 287, 197, 180, 247, 260, 247, 199, 179, 134, 163, 200, 209, 302, 187, 166, 234, 290, 175, 116, 342, 216, 316, 386, 324, 145, 254, 228)

次に、以下のコマンドにて、読み込んだ各データのグループ名を指定するための変数 'group' を作成する。データAからDの標本数はそれぞれ、'9, 10, 8, 8' であるが、それらが以下のコマンドの 'c(...)' に対応する。データの読み込み、およびその後の解析は、分散分析を行うときと同様にエクセルやテキストファイル形式のデータをデータフレームとしてそのまま読み込む方法でも良い。

1|$group=factor(rep(c("A", "B", "C", "D"), c(9, 10, 8, 8)))

以上で読み込んだ従属変数 (score) および独立変数 (group) を用いて、ルビーン検定は、'leveneTest(従属変数 ~ 独立変数)' というような形式で実行する。実際には以下のように打つ。

1|$leveneTest(score ~ group)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  3  2.2425  0.103
      31

結果の 'Df' で示されている列は自由度をあらわす。上は水準間 (級間・群間) の自由度であり、'水準数 - 1' で求められる値である。下は水準内 (級間・級内) の自由度であり、'全標本数 - 水準数' で求められる。'F-value' はF値であり、F分布に従う値である。'p-value' はp値の値で、'0.103' がルビーン検定におけるp値を示している。以上より、有意水準5%でも1%であっても、得られたp値は有意水準より大きく (p > α)、帰無仮説が保留され、その結果、各群の母分散は等しくないとはいえないという結論が導かれる。

以上がルビーン検定であるが、このRに実装されているルビーン検定は正規性からの逸脱に対してより頑強な結果を返すように修正された手法 (ブラウン-フォーサイス検定 (Browne-Forsythe test)) である。本来のルビーン検定は、オプションに 'center=mean' を指定することで実行できる。

オプションには以下のようなものがある。

OptionDescription
yformula (score ~ group) を指定。
center'center=mean' を指定すると、オリジナルのルビーン検定が実行される。デフォルトでは、'center=median' が指定される。
このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る