スポンサードリンク

こんにちは、ももやまです。

今日は、確率・統計分野の中で出てくる指数分布と、指数分布を使った確率を求める計算方法を紹介していきます。

※ 本記事では、確率・統計分野の確率密度関数、累積分布関数の知識を使用します。未学習の人や、復習したい人は、以下のリンク先の記事にて復習することをお勧めします。

スポンサードリンク

1. 指数分布とは

指数分布は、「つぎに事象が発生するまでの時間」をモデル化した分布です。

指数分布を使うことで、つぎのような問題を解くことができます。

例題

桃山工場で生産しているご飯盛り付け機(以後、機械と表記する。)がある。この機械は、過去のデータから、故障するまでの平均日数が1,000日であることが判明している。このとき、つぎの(1), (2)の問いに答えなさい。

(1) 機械が500日以内に故障する確率を求めなさい。

(2) 機械が少なくとも1,500日間正常に稼働し続ける(=故障が発生しない)確率を求めなさい。

スポンサードリンク

2. 指数分布の公式(累積分布関数)導出

ある事象が指数分布に従う(ことを仮定できる)場合、「つぎに事象が発生するまでの時間」を以下の公式で簡単に求めることができます。

指数分布を用いた

ある事象が単位時間あたりに、平均して λ 回発生するとする。

このとき、次に事象が発生するまでの時間が t 以内となる確率 F(t) は、つぎの式で計算できる。F(t)=1eλt

ここで、t は単位時間に対する経過時間を、単位時間に対する倍率で示した変数である。例えば、単位時間が10分で、次に事象が発生する時間が30分の場合、t=3010=3 となる。

また、この F(t) は指数分布の累積分布関数となる[1]累積分布関数とは、ある確率変数が特定の値以下になる確率を表す関数です

累積分布関数の導出は、ポアソン分布を使って導出することができます。

※ ポアソン分布の復習は以下の記事から出来ます。まだ未履修な人や、ポアソン分布を忘れてしまった人はご覧ください。

公式の導出

指数分布は「つぎに事象が発生するまでの時間が t 以内となる確率」を表しています。

この表現を言い換えると、「ある時間 t が経過するまでに、少なくとも事象が1回が発生する確率 P(X1)」言えます。この確率は、ポアソン分布の公式から計算することができます。

この確率は、「ある時間 t が経過するまでに、事象が1回も発生しない P(X=0) 」の補集合に相当します。つまり、つぎのように表すことが出来ます。P(X1)=1P(X=0)

ここで、ある事象が単位時間あたりに平均して λ 回発生するとします。このとき、X がポアソン分布に従う場合、事象が単位時間以内に k 回発生する確率は、次のように表されます。P(X=k)=λkk!eλ

ここで、単位時間 → 時間 t におきかえてみましょう。すると、経過時間 t において事象の発生する確率は λt となります。そのため、事象が t 以内に k 回発生する確率 P(X=k) は、つぎのように表されます。P(X=k)=λtkk!eλt

事象が1回も発生しない確率 P(X=0) が欲しいので、1つ前の式に k=0 を代入することで、つぎのように求められます。P(X=k)=λt00!eλt=eλt

よって、「ある時間 t が経過するまでに、少なくとも事象が1回が発生する確率 P(X1)」がつぎのように導出できます。P(X1)=1P(X=0)=1eλtこの式が、指数分布の累積分布関数となります。

スポンサードリンク

3. 例題で確認

ここからは、実際の問題例を通じて、指数分布の理解度を深めていきましょう。

例題

桃山工場で生産しているご飯盛り付け機(以後、機械と表記する。)がある。この機械は、過去のデータから、故障するまでの平均日数が1,000日であることが判明している。このとき、つぎの(1), (2)の問いに答えなさい。答えは小数第2位まで記すこと。

(1) 機械が500日以内に故障する確率を求めなさい。

(2) 機械が少なくとも1,500日間正常に稼働し続ける(=故障が発生しない)確率を求めなさい。

※ 必要であれば、以下の表で与えられる指数関数の値を用いてもよい。

x0.51.01.52.02.53.0
ex1.6492.7184.4827.38912.18220.086

(1)

まず、機械の故障までの平均日数が1,000日であることから、1,000日を1単位時間としましょう。

この場合、単位時間(=1,000日)ごとに平均1回の故障が発生するので、λ=1 となります。

今回求めたい確率は、500日(=0.5単位時間)以内に故障する確率なので、t=0.5 となります。

あとは、指数分布の累積分布関数F(t)=1eλtに、λ=1, t=0.5 を代入すればOKです。F(0.5)=1e10.5=1e0.5=11e0.5111.649=10.606=0.394

したがって、機械が500日以内に故障する確率は 0.39 と求められます。

(2)

機械が少なくとも1,500日正常に稼働し続ける(=故障しない)確率を求めていきます。

この確率は、1から「1,500日以内(=1.5単位時間)に機械が壊れる確率」から引くことで求めることができます。(余事象)

1,500日以内に機械が壊れる確率は、指数分布の累積分布関数F(t)=1eλtに、λ=1, t=1.5 を代入すれば求めることが出来ます。F(1.5)=1e11.5=1e1.5=11e1.5※ 指数関数は、最後に近似します。

よって、少なくとも1,500日機械が稼働する確率は、次のように計算できます。1F(1.5)=1(11e1.5)=1e1.514.482=0.223

したがって、機械が少なくとも1,500日正常に稼働し続ける確率は 0.22 と求められます。

4. 指数分布の確率密度関数

指数分布の累積分布関数は、次のように表されるのでしたね。F(t)=1eλt   (t0)

確率密度関数 f(t) は、この累積分布関数 F(t) を時間 t で微分することで求めることができます。

実際に微分すると、f(t)=ddtF(t)=ddt(1eλt)=λeλtと導出することができます。

指数分布の確率密度関数

指数分布の確率密度関数 f(t) は、以下の通りである。ただし、t0 である。f(t)=eλtt<0 のとき、f(t)=0

5. 指数分布の期待値・分散

指数分布の期待値と分散

指数分布で表される確率変数 X の期待値 E(X)、分散 V(X) は以下の通りである。E(X)=1λ,   V(X)=1λ2

指数分布の確率密度関数λeλt   (t0)から、期待値と分散を導出していきましょう。

※ 導出の途中で、解析学の知識(部分積分、ロピタルの定理、広義積分)を使います。復習したい方は、以下の記事にて学習ができます。

(1) 期待値

確率密度関数 f(t) で表される確率変数 X の期待値 E(X) は、次のように計算できるのでしたね。E(X)=tf(t) dt

実際に、指数分布をこの式に代入して計算してみましょう。E(X)=tf(t) dt=0tλeλt dt=limR0Rtλeλt dt=limR[teλt]0R0Reλt dt=limRReλR(0eλ0)0Reλt dt=limRReλR[1λeλt]0R=limRReλR(1λeλR1λeλ0)=limRReλR1λeλR+1λ1=limRReλR1λeλR+1λ1=limRλR+1λeλR+1λ=1λlimRλR+1λeλR=1λlimRλλ2eλR0=1λと導出できます。

よって、指数分布の期待値をE(X)=1λと導出することができます。

(2) 分散

確率密度関数 f(t) の分散は、次のように計算できるのでしたね。V(X)=E(X2){E(X)}2=t2f(t) dt{E(X)}2

実際に、E(X2) を計算してみましょう。E(X)=t2f(t) dt=0t2λeλt dt=limR0λt2eλt dt=limRλ[t2(1λeλt)2t(1λ2eλt)+2(1λ3eλt)]0R=λlimR[t2λ2+2tλ+2λ3eλt]0R=λlimRR2λ2+2Rλ+2λ3eλR(02λ2+20λ+2λ3eλ0)=λlimRR2λ2+2Rλ+2λ3eλR+2λ3=2λ3λλlimRR2λ2+2Rλ+2λ3eλR=2λ2λlimR2Rλ2+2λλ4eλR=2λ2λlimR2λ2λ5eλR0=2λ2※ 部分積分をする際に、省略公式(ブンブン積分)を使用しています。

よって、確率密度関数 f(t) の分散を、つぎの通りに導出できます。V(X)=E(X2){E(X)}2=2λ2(1λ)2=2λ21λ2=1λ2

指数分布の期待値と分散

指数分布で表される確率変数 X の期待値 E(X)、分散 V(X) は以下の通りである。E(X)=1λ,   V(X)=1λ2

6. 練習問題にチャレンジ

最後に、練習問題を解いて理解が出来ているか確かめましょう。

練習問題

桃山先生が営んでいるカフェ「喫茶モモ」では、10分あたり平均1人の来店がある。このとき、(1)~(4)の問いに答えなさい。

(1) 15分以内に客が来店する確率を求めなさい。
(2) 少なくとも30分間、1人も客が来店しない確率を求めなさい。
(3) つぎの客が来るまでの時間に関する期待値 [分] と、分散 [分2]を答えなさい。
(4) つぎの客が来るまでの時間に関する中央値 [分] 、第1四分位数 [分] 、第3四分位数 [分] を答えなさい。

※1 必要であれば、以下の表で与えられる指数関数の値を用いてもよい。

x0.51.01.52.02.53.0
ex1.6492.7184.4827.38912.18220.086

※2 必要であれば、log2=0.693, log3=1.099 を用いてもよい。ただし、loge を底とする対数である。

7. 練習問題の答え

今回は、(3),(4)で [分] 単位で答える問題があるので、1単位時間を1分としましょう。

ここで、10分(=10単位時間)あたり平均1人来店があるので、1単位時間あたりの来店人数は平均0.1人となります。つまり、λ=0.1 となります。

(1)

15分(=15単位時間)に客が来店する確率は、指数分布の累積分布関数F(t)=1eλtに、t=15 を代入したときの値 F(15) を求めればOKです。

実際に計算すると、つぎのように計算できます。F(15)=1e0.115=1e1.5=11e1.5114.482=10.223=0.777

よって、15分以内に客が来店する確率は 0.78 となります。

(2)

少なくとも30分間(=30単位時間)、1人も客が来店しない確率は、t=30 での累積分布関数 F(30) の補集合、つまり 1F(30) で計算できます。

ここで、λ=0.1, t=30 を累積分布関数F(t)=1eλtに入れて計算してみましょう。

すると、つぎのように計算ができます。F(30)=1e0.130=1e3=11e3

よって、1F(30)=1(11e3)=1e3120.086=0.050と計算できるため、少なくとも30分間、1人も客が来店しない確率は0.05と求められます。

(3)

確率変数 X が指数分布に従う場合、期待値 E(X), 分散 V(X) は次のように計算ができます。E(X)=1λ,   V(X)=1λ2

この式に λ=0.1 を代入すると、つぎの客が来るまでの期待値と分散を求めることができます。

実際に代入すると、E(X)=1λ=10.1=10V(X)=1λ2=10.12=10.01=100となるため、期待値は 10[分]、分散は100[分2]と求められます。

(4)

中央値

累積分布関数が以下の値となるときの t の値を求めればOKです。F(t)=12

実際に、λ=0.1 を累積分布関数に入れて t の値を計算していきましょう。1eλt=12eλt=12eλt=12logeλt=log12λt=log2t=1λlog2=10.1log2=10log2100.693=6.93

よって、中央値は6.93[分]となります。

第1四分位数

累積分布関数が以下の値となるときの t の値を求めればOKです。F(t)=14

中央値のときと同じように、λ=0.1 を累積分布関数に入れて t の値を計算していきましょう。1eλt=14eλt=34eλt=34logeλt=log34λt=log3log4t=1λ(log4log3)=10.1(2log2log3)=10(2log2log3)10(20.6931.099)=100.287=2.87

よって、第1四分位数は2.87[分]となります。

第3四分位数

累積分布関数が以下の値となるときの t の値を求めればOKです。F(t)=34

同じように、λ=0.1 を累積分布関数に入れて t の値を計算していきましょう。1eλt=34eλt=14eλt=14logeλt=log14λt=log4t=1λlog4=10.12log2=20log2200.693=13.86

よって、第3四分位数は13.86[分]となります。

注釈

注釈
1 累積分布関数とは、ある確率変数が特定の値以下になる確率を表す関数です

関連広告・スポンサードリンク

おすすめの記事