代表値のいろいろ

一般的に 'average' という単語は日本語では '平均' と訳されることが多いが、厳密には平均というよりは代表値と訳すのが正しい。統計学における真の意味での平均は 'mean' であり、averageはこのmeanに加え、最頻値を意味する 'mode' および中央値を意味する 'median' 等の総称であるからである。

Meanは一般的に平均と呼ばれるものである。さらに、相加平均を始めとし相乗平均、二乗平均および調和平均などに細分化されるが最もよく用いられる平均は相加平均または算術平均と呼ばれる平均である。相加平均μはn個からなる統計量Xについて以下のようにあらわされる。

\mu=\frac{1}{n}\sum_{i=1}^{n}x_i

Modeとは分布の峰に対応する値のことである。最頻値ともあらわされる。{1, 1, 2, 3, 5, 6, 8, 8, 8, 8, 8, 9, 15, 1024, 2048}のような分布があるとしたときにおける最も出現頻度が高い値 '8' が最頻値である。最頻値はヒストグラムにおいてはその度数が最大である階級の階級値を示す。

Medianは分布の最も中央に位置する値のことである。上と同様に{1, 1, 2, 3, 5, 6, 8, 8, 8, 8, 8, 9, 15, 1024, 2048}のような分布を考えた際に、この分布の相加平均である210.3はこの分布を代表させる値としてふさわしくない。明らかに1024および2048の飛び値によって引っ張られている。そこでこのような場合には分布を昇順または降順に並び替えてそのちょうど真ん中の値を代表値として採用する。これがmedianである。

このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る