チェビシェフの不等式

チェビシェフの不等式とは、確率変数Xの平均値をμ、標準偏差をσとしたときに以下で与えられる不等式である。任意の確率分布において、ある値 (μ+kσ または μ-kσ) 以上または以下の確率がどれくらいかの大体の見当をつけるのに用いる。また、大数の法則の導入にも用いられる。

P(|X-\mu|\geq k\sigma)\leq\frac{1}{k^2}

例えば、正規分布のように研究し尽くされた分布については以下のような塗りつぶされた範囲の面積 (=確率) を知ることは簡単である。以下は標準正規分布であり、μ+1.96σ以上の曲線下範囲を塗りつぶしてある。正規分布においてはμ±1.96σの範囲は全面積の95%を占めるので、以下の塗りつぶされた面積は"(100-95)/2=2.5"より2.5%である。

正規分布1.96シグマ

以上のようによく知られた分布では標本がある値以上となる確率 (標本を抜き出したとき、その値がある値以上である確率) を簡単に求めることができるが、複雑な分布の場合そうはいかない。しかし、チェビシェフの不等式を用いればどのような確率分布においても標本の分布の情報を知ることができる。

まず、上のチェビシェフの不等式は以下のように確率変数Xがμ以上の場合確率変数Xがμより小さい場合の2つに分けて表すことができる。

P(X\geq \mu+k\sigma)\leq\frac{1}{k^2}\,\,\,\,\ (X\geq\mu)\\P(X\leq \mu-k\sigma)\leq\frac{1}{k^2}\,\,\,\,\ (X<\mu)

これらの式は以下のように解釈する。上の"確率変数Xがμ以上の場合"であるときを例にすると、ある確率変数Xから標本をひとつ抜き出したとき、それがμ+kσ以上である確率は1/k2以下である、ということである。または、ある確率分布においてμ+kσ以上の面積は全体の1/k2以下である、とも解釈できる。

例えば以下のような標準正規分布においてμ-2σ (=0-2*1=-2) 以下となる面積 (=確率) を考える。

正規分布-2シグマ

この面積はチェビシェフの不等式を用いることで以下のように1/4、つまり全体の25%以下と計算される。実際、標準正規分布においてμ±2σは全体の95.4%の面積を占めるので、μ-2σ以下の面積は"(100-95.4)/2=2.3"より約2.3%と計算される。これはチェビシェフの不等式で求めた"25%以下"を満たしている。

P(X\leq \mu-2\sigma=-2)\leq\frac{1}{2^2}=\frac{1}{4}
このエントリーをはてなブックマークに追加

Site search

ページのトップへ戻る