平均・期待値

平均値 (期待値) は分散および標準偏差と並んで統計学におけるもっとも重要な値であるといえる。平均値E(X)は標本数をn、各標本値をxi、その生起確率をpiとして以下の式で表される。

E(X)=\sum_{i=1}^{n}x_ip_i

この式は、小学校で習う平均および中学校で習う期待値とまったく同じことを意味している。まず、よく用いられる以下の式と上の式との関係性について。

\frac{x_1+x_2+\cdot\cdot\cdot+x_n}{n}=\sum_{i=1}^{n}\frac{x_i}{n}

以上の式は平均を表すものとして広く用いられているが、この式を以下のように展開・変形する。

\sum_{i=1}^{n}\frac{x_i}{n}=\frac{1}{n}x_1+\frac{1}{n}x_2+\cdot\cdot\cdot+\frac{1}{n}x_n

このように変形させることで上の式は、"標本値1*その生起確率1/n"+"標本値2*その生起確率1/n"+・・・+"標本値n*その生起確率1/n"のように解釈できる。ここで、'p1 = p2 = ... = pi = 1/n' である。つまり以下のように式の変形ができ、最初の式と同一であることが分かる。

\sum_{i=1}^{n}\frac{x_i}{n}&=&\frac{1}{n}x_1+\frac{1}{n}x_2+\cdot\cdot\cdot+\frac{1}{n}x_n\\&=&x_1p_1+x_2p_2+\cdot\cdot\cdot+x_np_n\\&=&\sum_{i=1}^{n}x_ip_i\\&=&E(X)

平均値の式は母集団に用いるとその集団の母平均を導く。

E(X)=\sum_{i=1}^{n}x_ip_i=\mu

一方で、標本集団に用いた場合はその集団の標本平均を導く。

E(X)=\sum_{i=1}^{n}x_ip_i=\overline{x}

以上の平均値は相加平均 (算術平均) といわれる平均であり最もよく用いられるものであるが、その他にも平均には相乗平均 (幾何平均)、調和平均、二乗平均等がある。

相乗平均 (幾何平均) は以下で与えられる値である。地価の上昇率や企業の成長率などの平均に用いる。

\mu_\mathrm G&=&\sqrt[n]{\prod_{i=1}^{n}x_i}\\&=&\sqrt[n]{x_1x_2\cdots x_n}

調和平均は以下で与えられる値である。平均速度の算出やドル・コスト平均法で用いられる。

\mu_\mathrm H&=&\frac{n}{\displaystyle\sum_{i=1}^{n}\frac{1}{x_i}}\\&=&\frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\cdots+\frac{1}{x_n}}

二乗平均は以下で与えられる値である。標準偏差を求めるのに用いる。また、タンパク質立体構造の重ね合わせの精度の指標にも用いられる。

\mu_{RMS}&=&\sqrt{\frac{1}{n}\displaystyle\sum_{i=1}^{n}x_i^{2}}\\&=&\sqrt{\frac{x_1^2+x_2^2+\cdot\cdot\cdot+x_n^2}{n}}
このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る