四分位偏差

分散平均偏差以外でデータのばらつきをあらわす指標のひとつに四分位偏差 (quartile deviation) がある。四分位偏差はデータの四分位点 (quartile) から計算できる。

四分位点とは、昇順に並べたデータを4等分したときの3つの分割点のことである。第1四分位点 (四分位数)、第2四分位点、第3四分位点の3つからなる。全データのメディアンが第2四分位数であり、第2四分位数 (メディアン) を除いた2つデータにおいて、平均値が小さいほうのデータのメディアンが第1四分位数、大きいほうのデータのメディアンが第3四分位数である。すなわち、データ小さいほうから数えて、全データの25%をカバーする点が第1四分位数、50%が第2四分位数、75%が第3四分位数となる。

以上の四分位点を用いて、四分位偏差 'Sq' は以下の式で与えられる。ここで、Q1は第1四分位数、Q3は第3四分位点を示す。

\begin{eqnarray*}S_q=\frac{1}{2}(Q_3-Q_1)\end{eqnarray*}

すなわち、四分位偏差とは、全データのメディアン (第2四分位数) 周りの50% (Q3 - Q1)のばらつく具合を示す値である。データ中の極端に大きな値、または小さな値 (外れ値) の影響を受けにくい指標である。

このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る