分散・標準偏差

分散ならびに標準偏差とはデータ集団の分布の広がりをあらわす量である。データXに対して、それぞれV(X)およびD(X)と表記されることがある。平均値と併せて統計学で最もよく用いられるパラメーターである。

母集団の分散および標準偏差は母分散および母標準偏差と呼び、それぞれσ2およびσであらわされる。この量は対象とするデータ集団が母集団であるときに用いるものである。nはデータ数、μは平均値。

\sigma^2=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2
\sigma=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\mu)^2}{n}}

一方で、標本集団の分散および標準偏差は標本分散および標本標準偏差と呼び、それぞれs2およびsであらわされる。これらの量は標本集団そのもののばらつきを知りたいときにのみ用いる。母分散および母標準偏差の不偏推定量ではない。nはデータ数、xは平均値。

s^2=\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n}
s=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n}}

また、標本集団から母集団の分散 (母分散) および 標準偏差 (母標準偏差) を不偏推定する量は不偏分散および不偏標準偏差であり、u2およびuであらわされる。nはデータ数、xは平均値。

u^2=\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n-1}
u=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\overline{x})^2}{n-1}}
このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る