スポンサードリンク
こんにちは、ももやまです。
今日は、確率・統計分野の中で出てくる指数分布と、指数分布を使った確率を求める計算方法を紹介していきます。
※ 本記事では、確率・統計分野の確率密度関数、累積分布関数の知識を使用します。未学習の人や、復習したい人は、以下のリンク先の記事にて復習することをお勧めします。
目次 [hide]
スポンサードリンク
1. 指数分布とは
指数分布は、「つぎに事象が発生するまでの時間」をモデル化した分布です。
指数分布を使うことで、つぎのような問題を解くことができます。
桃山工場で生産しているご飯盛り付け機(以後、機械と表記する。)がある。この機械は、過去のデータから、故障するまでの平均日数が1,000日であることが判明している。このとき、つぎの(1), (2)の問いに答えなさい。
(1) 機械が500日以内に故障する確率を求めなさい。
(2) 機械が少なくとも1,500日間正常に稼働し続ける(=故障が発生しない)確率を求めなさい。
スポンサードリンク
2. 指数分布の公式(累積分布関数)導出
ある事象が指数分布に従う(ことを仮定できる)場合、「つぎに事象が発生するまでの時間」を以下の公式で簡単に求めることができます。
ある事象が単位時間あたりに、平均して
このとき、次に事象が発生するまでの時間が
ここで、
また、この
累積分布関数の導出は、ポアソン分布を使って導出することができます。
※ ポアソン分布の復習は以下の記事から出来ます。まだ未履修な人や、ポアソン分布を忘れてしまった人はご覧ください。
公式の導出
指数分布は「つぎに事象が発生するまでの時間が
この表現を言い換えると、「ある時間
この確率は、「ある時間
ここで、ある事象が単位時間あたりに平均して
ここで、単位時間 → 時間
事象が1回も発生しない確率
よって、「ある時間
スポンサードリンク
3. 例題で確認
ここからは、実際の問題例を通じて、指数分布の理解度を深めていきましょう。
桃山工場で生産しているご飯盛り付け機(以後、機械と表記する。)がある。この機械は、過去のデータから、故障するまでの平均日数が1,000日であることが判明している。このとき、つぎの(1), (2)の問いに答えなさい。答えは小数第2位まで記すこと。
(1) 機械が500日以内に故障する確率を求めなさい。
(2) 機械が少なくとも1,500日間正常に稼働し続ける(=故障が発生しない)確率を求めなさい。
※ 必要であれば、以下の表で与えられる指数関数の値を用いてもよい。
0.5 | 1.0 | 1.5 | 2.0 | 2.5 | 3.0 | |
---|---|---|---|---|---|---|
1.649 | 2.718 | 4.482 | 7.389 | 12.182 | 20.086 |
(1)
まず、機械の故障までの平均日数が1,000日であることから、1,000日を1単位時間としましょう。
この場合、単位時間(=1,000日)ごとに平均1回の故障が発生するので、
今回求めたい確率は、500日(=0.5単位時間)以内に故障する確率なので、
あとは、指数分布の累積分布関数
したがって、機械が500日以内に故障する確率は 0.39 と求められます。
(2)
機械が少なくとも1,500日正常に稼働し続ける(=故障しない)確率を求めていきます。
この確率は、1から「1,500日以内(=1.5単位時間)に機械が壊れる確率」から引くことで求めることができます。(余事象)
1,500日以内に機械が壊れる確率は、指数分布の累積分布関数
よって、少なくとも1,500日機械が稼働する確率は、次のように計算できます。
したがって、機械が少なくとも1,500日正常に稼働し続ける確率は 0.22 と求められます。
4. 指数分布の確率密度関数
指数分布の累積分布関数は、次のように表されるのでしたね。
確率密度関数
実際に微分すると、
指数分布の確率密度関数
5. 指数分布の期待値・分散
指数分布で表される確率変数
指数分布の確率密度関数
※ 導出の途中で、解析学の知識(部分積分、ロピタルの定理、広義積分)を使います。復習したい方は、以下の記事にて学習ができます。
(1) 期待値
確率密度関数
実際に、指数分布をこの式に代入して計算してみましょう。
よって、指数分布の期待値を
(2) 分散
確率密度関数
実際に、
よって、確率密度関数
指数分布で表される確率変数
6. 練習問題にチャレンジ
最後に、練習問題を解いて理解が出来ているか確かめましょう。
桃山先生が営んでいるカフェ「喫茶モモ」では、10分あたり平均1人の来店がある。このとき、(1)~(4)の問いに答えなさい。
(1) 15分以内に客が来店する確率を求めなさい。
(2) 少なくとも30分間、1人も客が来店しない確率を求めなさい。
(3) つぎの客が来るまでの時間に関する期待値 [分] と、分散 [分2]を答えなさい。
(4) つぎの客が来るまでの時間に関する中央値 [分] 、第1四分位数 [分] 、第3四分位数 [分] を答えなさい。
※1 必要であれば、以下の表で与えられる指数関数の値を用いてもよい。
0.5 | 1.0 | 1.5 | 2.0 | 2.5 | 3.0 | |
---|---|---|---|---|---|---|
1.649 | 2.718 | 4.482 | 7.389 | 12.182 | 20.086 |
※2 必要であれば、
7. 練習問題の答え
今回は、(3),(4)で [分] 単位で答える問題があるので、1単位時間を1分としましょう。
ここで、10分(=10単位時間)あたり平均1人来店があるので、1単位時間あたりの来店人数は平均0.1人となります。つまり、
(1)
15分(=15単位時間)に客が来店する確率は、指数分布の累積分布関数
実際に計算すると、つぎのように計算できます。
よって、15分以内に客が来店する確率は 0.78 となります。
(2)
少なくとも30分間(=30単位時間)、1人も客が来店しない確率は、
ここで、
すると、つぎのように計算ができます。
よって、
(3)
確率変数
この式に
実際に代入すると、
(4)
中央値
累積分布関数が以下の値となるときの
実際に、
よって、中央値は6.93[分]となります。
第1四分位数
累積分布関数が以下の値となるときの
中央値のときと同じように、
よって、第1四分位数は2.87[分]となります。
第3四分位数
累積分布関数が以下の値となるときの
同じように、
よって、第3四分位数は13.86[分]となります。
注釈
↑1 | 累積分布関数とは、ある確率変数が特定の値以下になる確率を表す関数です |
---|
関連広告・スポンサードリンク