慶應大学講義 応用確率論 第三回 分散 標準偏差 チェビシェフの不等式
Youtubeに慶応大学の統計講座が上がっていました。

今回の講義動画の焦点はネコでもわかるチェビシフの不等式50分目からですね。

独習者にとってはありがたい限りです。
内容覚書。

離散系 Y=f(X)の平均

事象F'、結果f(x),確率Pとするとき
例えば下記のような確率変数があったとしよう

F'_____A1_____A2____A3___A4____A5
f(x) f(x1) f(x2) f(x3) f(x4) f(x5)
P_______P1____P2____P3___P4____P5

Y=f(X)が
f(x1)=f(x3)=f(x4)=y1
f(x2)=f(x5)=y2
だったとする。
2通りの結果しかないので
この場合確率変数の表は

G' B1 B2
Y _y1 y2
Q _q1 q2

となりAは根源事象の組み合わせなので背反より
q1=P(A1∨A3∨A4)=P(A1)+P(A3)+P(A4)=p1+p3+p4
q2=P(A2∨A5)=p2+p5
E(Y)=q1*y1+q2*y2=(p1+p3+p4)y1+(q2+q5)y2
=f(x1)p1+f(x3)p3+f(x4)p4+f(x2)p2+f(x5)p2
となる。

つまりY=f(x)の平均について纏めると
E(Y)=Σf(x)pi
という当然の話となる。



分散

2つの確率変数の表があったとする。


F'__A1___A2___A3
X __10__100_1000
P 6/10 3/10 1/10


F'__A1____A2___A3
X 120 150 190
P 6/10 3/10 1/10
平均は同じだが前者の方がばらつきが大きい。
これを分散としてあらわす。
この表を株価の変動予測のようなものだと考えるとこのような表は意味を持つ。

①はリターンが大きいがリスクも大きい
②はリターンが小さいがリスクは小さい

こういうのを分析には分散がよい。
分散は良い性質を持つ統計量。

例えば
幾ら分散が小さくても大損がある分布とかは怖いよな。

分散とは平均からの距離の2乗の平均。
この定義は分かりやすい。

①や②の分散は円に対する計算なので分散を表す単位は 円^2
分散の計算結果も物理量と同じ単位が必要。


チェビシフ不等式

平均と分散しかわからないデータから、具体的にどんな値がどれだけでるのかについて考察した場合にでてくる不等式。
e=xの平均として
e-ε~e+εの外に値を取る<=V(x)/(ε^2)となるらしい。
この数式だけだと出にくさの比として出てくるから%になおす式が必要に思えるが?
εをV(x)の定数倍とすると計算が簡単になり定数が出てくる。
ε=3V(x)は
チェビシフの不等式はV(x)/9V(x)=1/9のようになる。
よって上記の場合
平均と分散が与えられたとき標準偏差の3倍の範囲内に値が出てくる確率は
1-1/9=8/9となる。

不等式の証明
分散の式はV(x)=∫(実数全体)(x-e)p(x)dxとなり
このうち不等式で計算したい範囲は
a=∫(|x-e|>=ε)(x-e)^2p(x)dx
aはxからε以上離れた部分の積分。

当然積文は単調増加なので
V(x)>=aが成り立つ。
さらに
|xi-x|>εなので
a>=b=∫)(|x-e|>=εの範囲)ε^2*p(x)dx
が成り立つ。
b=ε^2∫p(x)dx=ε^2*P({w{|x(w)-e|=>ε})
結果
V(x)まで三段論法でさかのぼって
V(x)/ε^2>=P({w{|x(w)-e|=>ε})
となる。
うーんなるほど!

タグ:

+ タグ編集
  • タグ:

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約 が適用されます。

最終更新:2012年08月23日 16:37