はじめに
この記事は統計学入門1のを読んだことをまとめた振り返り記事です。
(i)
確率変数Xが指数分布に従うとき、
P(X>a+b∣X>a)=P(X>b)
を示せ。またこの意味は何か?
(ii)
指数分布Ex(x;λ)の密度関数f(x)、累積分布関数をF(x)とする。関数
λ(x):=1−F(x)f(x)
は定数となり、λに等しいことを示せ。このλ(x)を瞬間故障率という。
問題
(i)
指数分布の分布関数は
f(x)=λe−λx(x≥0)
です(x<0の場合は0)。問題文にあるのは条件付き確率であり、x=aの時点でイベントが起き、a+bの時点でもイベントが起きる条件付き確率を計算させています。よって、
P(X>a+b∣X>a)=P(X>a)P(X>a+b)=e−λae−λ(a+b)=e−λb
となります。一方、P(X>b)は
P(X>b)=e−λb
となります。よって、
P(X>a+b∣X>a)=P(X>b)
となります。
この意味は、ある時間xでイベントが起きる確率は、その時間xがどれだけ長いかに関係なく、常に同じ確率であるということを表しているということです。感覚的には、あるイベントが起きると、また連続して起きやすい・起きにくいんじゃないかと勘繰ってしまうかもしれませんが、そんなことはなく、過去の履歴に関わらず、常に同じ確率であるということを表しているということです。
(ii)
累積確率分布は
F(x)=∫−∞xf(t)dt=∫0xλe−λtdt=1−e−λx(x≥0)
です。よって、
λ(x)=1−F(x)f(x)=e−λxλe−λx=λ
と定数になります。故障する時間がこの指数分布に従うとするならば、ある時間xで故障する確率は常に同じ確率であるということを表しており、記憶喪失性が反映されています。
解答