スポンサードリンク
こんにちは、ももやまです。
今回から7回にわけて、数Bの「確率分布と統計的な推測」の分野の簡単なまとめを書いていきたいと思います。
主に、
- センター(共通テスト)2Bで「数列」や「ベクトル」が苦手なので「確率分布と統計的な推測」を選択したい人
- 大学で「確率・統計」を学ぶ人
を対象としています。
また、1つの記事を約1時間、合計7時間で一通り「確率分布と統計的な推測」を理解できるような分量になっているため、テスト直前でも一通り内容が確認できます。
目次 [hide]
スポンサードリンク
1.確率変数・確率分布
教科書を読んでいくと、「ある確率変数
ということでまずは、確率変数、確率分布がどんなものなのかを簡単にですが説明していきたいと思います。
(1) 確率変数
確率変数とは、確率によっていろいろな値をとる変数のことを表します。
例えば、(表裏が同じ確率で出る)コインを2回投げたときに、表が出る回数
このとき、コインの表裏の組み合わせとしては、「表・表」、「表・裏」、「裏・表」、「裏・裏」の4通りがあるので表が出る回数とその確率は、
2回(
1回(
0回(
となります。
このように表が出る回数
(2) 確率分布
先程、コインの表が出る回数
確率分布とは、確率変数が取りうる値とその確率を対応させたものが確率分布となります。
先程のコインの例(2回投げたときの表が出る回数)でいくと、確率分布は
2回(
1回(
0回(
となります。なお、
(ちなみに、PはProbability(確率)のPです。)
また、確率分布は表で表されることもあります(確率分布表と呼びます)。先程のコインの例の場合、
X | 0 | 1 | 2 |
確率 |
となります。
確率変数:確率によって値が変動する変数のこと
確率分布:確率変数がどのように(取りうる値とその確率の対応)変化するかを示したもの。
「確率分布と統計的な推測」では、数1Aで習った「確率」をより統計的に勉強しよう…! という単元となっています。
数Aの確率が苦手… という人も安心してください。数Bの「確率分布と統計的な推測」では数Aのような難しい確率の問題は出てきません*2。
なので安心して進めていきましょう。
スポンサードリンク
2.平均・分散・標準偏差
確率変数・確率分布について説明したので、「確率分布と統計的な推測」で出てくる「平均」、「分散」、「標準偏差」の3つのワードについて説明していきましょう。
ですが、皆さんは数1の「データの分析」ですでに3つのワードを習っているかと思います。
なのでこの部分はほぼ「データの分析」の復習となります。
「確率分布と統計的な推測」で習う「平均」、「分散」、「標準偏差」は「データの分析」で習ったものをより統計分野で扱いやすくするために拡張したものとなります。
なお、ここでは確率変数
(
(1) 平均(期待値)
ある確率変数
つまり、「それぞれの
たとえば、コインを2回投げたときに表が出る回数を
2回(
1回(
0回(
となるので平均
(2) 分散
ある確率変数
平均が
つまり、
- それぞれの
の取りうる値と平均の差(偏差)を2乗したもの × となる確率をすべて足したもの*4(こちらが定義) - それぞれの
の取りうる値 × となる確率を足したもの - 平均を2乗したもの
のどちらかで分散を求めることができます。
偏差を2乗するのは、「平均よりも大きいほうにずれている(プラス)」のと「平均よりも小さいほうにずれている(マイナス)」ものをすべて正にするためです。
たとえば、コインを2回投げたときに表が出る回数を
X | 0 | 1 | 2 |
偏差 | -1 | 0 | 1 |
偏差^2 | 1 | 0 | 1 |
確率 |
あとは「それぞれの
また、もう1つの求め方「それぞれの
分散の公式の使い分け
2つ目の分散の公式
例えば、次のような表で与えられる確率変数
X | 0 | 1 | 2 |
確率 |
\]となります。
定義(偏差の2乗を使う方)に従った場合
まず、それぞれの
X | 0 | 1 | 2 |
偏差 | |||
偏差^2 | |||
確率 |
「それぞれの
もう1つのやり方の場合
もう1つの分散の公式を用いると、
(整数 - 分数)の偏差の2乗を用いた計算がなくなるので少し楽に計算することができますね!
(3) 標準偏差
分散
そこで、分散
例えば、コインを2回投げたときに表が出る回数を
なお、「(標準偏差)=(分散のルート)」の定義は、「データの分析」と全く同じです。
(4) データの分析っぽく解いてみる
先程出てきた、「平均(期待値)」、「分散」、「標準偏差」をデータの分析っぽく直してみましょう。
例えば、コインを2回出たときの表が出る回数
X | 0 | 1 | 2 |
確率 |
これをデータの分析っぽく解いていきましょう。
コツは、それぞれの
つまり、
相対度数を度数(データ数)に書き換えると*6、
- 4人中1人(相対度数:1/4)が0回
- 4人中2人(相対度数:1/2)が1回
- 4人中1人(相対度数:1/4)が2回
となるので、下のような「データの分析」で出てくる結果表に書き換えることができます。
人 | A | B | C | D |
回数 |
0 | 1 | 1 | 2 |
あとは、平均、分散、標準偏差を求めるだけです。
平均
それぞれの
スポンサードリンク
3.データの変化における平均・分散・標準偏差の変化
ある確率変数
(1) Xがa倍になった場合
ある確率変数
ある確率変数
(i)
(ii)
(iii)
数式を見てもいまいちよくわからないと思うので、「コインを投げて、表が出た回数をそのまま点数
例えば、「1回表が出たら1点ではなく、倍の2点をあげよう」というルールに変わったとします。すると、得点は
つまり、点数を2倍にすると、平均も2倍になることを意味しています。それはそう。
また、
つまり、点数を2倍にすると、ばらつき具合も2倍になることを意味しています。
なお、
(2) Xに定数 b を足した場合
ある確率変数
ある確率変数
(i)
(ii)
(iii)
先程と同じ例(コインを投げて、表が出た回数をそのまま点数
例えば、「ハンデとして最初から1点あげよう」というルールに変わったとします。すると、得点は
つまり、1点下駄を履かせることで、平均も1点増えることを意味しています。それはそう。
また、
つまり、1点下駄を履かせようがばらつき具合は変わらないことを意味しています。
当然ですよね。どんな場合でも1点加算されるので、ばらつき具合は一切変わりません。
ばらつき具合が変わらないので当然分散も変化しません。
(3) XがaX + bになったとき
(1), (2)をまとめると、下のような公式が完成します。
公式をそのまま覚えるのではなく、意味を理解しておくことをおすすめします。
ある確率変数
(i) 平均
(ii) 分散
(iii) 標準偏差
4.独立な確率変数とは
ある2つの確率変数
具体例を3つほど見ていきましょう。
(1) サイコロ
サイコロで1回目に出た出目を
このとき、1回目に何が出ようが2回目の出目には一切関係ありませんよね。つまり、
(2) くじ引き(元に戻すVer)
0, 1, 2, 3の数字が書かれた4つのくじがあります。
1回目に引いたくじに書かれている数字を
このとき、2回目の数字
なので、この場合も確率変数
(3) くじ引き(元に戻さないVer)
(2)と同じく0, 1, 2, 3の数字が書かれた4つのくじがあるとします。
1回目に引いたくじに書かれている数字を
このとき、2回目の数字
なので、この場合は確率変数
確率変数
5.2つの確率変数における 平均 / 分散 の変化
2つの確率変数
(1) 和の平均 E(X+Y) = 平均の和 E(X)+E(Y)
2つの確率変数
具体例で1つ試してみましょう。
箱A:1, 2, 3の数字が書かれたくじが入っている
箱B:0, 2, 4の数字が書かれたくじが入っている
とします。
このとき、2つの箱A, Bから無作為に1つずつくじを取り出し、箱Aから取り出したくじに書かれている数字を
(i) 地道にもとめてみる
まずは全パターンを列挙して平均
(X,Y) の組み合わせとして
X + Y = 1:1通り (1,0)
X + Y = 2:1通り (2,0)
X + Y = 3:2通り (1,2) or (3,0)
X + Y = 4:1通り (2,2)
X + Y = 5:2通り (1,4) or (3,2)
X + Y = 6:1通り (2,4)
X + Y = 7:1通り (3,4)
の全9パターンがあります。よって、平均
(ii) 公式を使う
では、「和の平均=平均の和」の公式を使ってみましょう。
(2) X, Y が独立のとき「積の平均 E(XY) =平均の積 E(X)E(Y)」
2つの確率変数
具体例で1つ試してみましょう。先程と同じく、
箱A:1, 2, 3の数字が書かれたくじが入っている
箱B:0, 2, 4の数字が書かれたくじが入っている
とします。
このとき、2つの箱A, Bから無作為に1つずつくじを取り出し、箱Aから取り出したくじに書かれている数字を
(i) 地道にもとめてみる
まずは全パターンを列挙して平均
(X,Y) の組み合わせとして
XY = 0:3通り (1,0), (2,0), (3,0)
XY = 2:1通り (1,2)
XY = 4:2通り (1,4) or (2,2)
XY = 6:1通り (3,2)
XY = 8:1通り (2,4)
XY = 12:1通り (3,4)
の全9パターンがあります。よって、平均
(ii) 公式を使う
今回は、
(3) X, Yが独立のとき「分散 V(X+Y) = V(X) + V(Y)」
2つの確率変数
つまり、独立した確率変数
同じく、
箱A:1, 2, 3の数字が書かれたくじが入っている
箱B:0, 2, 4の数字が書かれたくじが入っている
場合で試してみましょう。
このとき、2つの箱A, Bから無作為に1つずつくじを取り出し、箱Aから取り出したくじに書かれている数字を
(i) 地道にもとめてみる
(1)で、
まず、それぞれの値における残差、残差の2乗を求めましょう。
X+Y=1 [1通り] 残差:-3 残差の2乗:9
X+Y=2 [1通り] 残差:-2 残差の2乗:4
X+Y=3 [2通り] 残差:-1 残差の2乗:1
X+Y=4 [1通り] 残差:0 残差の2乗:0
X+Y=5 [2通り] 残差:1 残差の2乗:1
X+Y=6 [1通り] 残差:2 残差の2乗:4
X+Y=7 [1通り] 残差:3 残差の2乗:9
となるので、分散
(ii) 公式を使う
では、「散らばり具合の和=和の散らばり具合」の公式を使ってみましょう。
なお、標準偏差でも同じこと、つまり2つの確率変数
ある確率変数
また、確率変数
(4) 公式の使用例
例えば、「コインを10回投げたときに表が出る回数
しかし、いちいち10回表が出る確率、9回表が出る確率……、0回表が出る確率を全部計算していくのはめんどくさいですよね。
ですが、コインを2回投げたときに表が出る確率
なので、コインを10回投げた事象
さらに、
※ なお、もっと早く求める方法もあるのですが、それは次回までのお楽しみということで!
6.練習問題
では、練習をしてみましょう!
なお、センター試験を想定しているため、穴埋め式としています。
大きいサイコロと小さいサイコロの2つがある。大きいサイコロで出た目を
(ただし X, Y の出目は 1, 2, 3, 4, 5, 6 の6つであり、どれも同じ確率で出るものとする。)
また、
ここで、
このとき、
7.練習問題の答え
※ 実際のセンター試験では、ここまで丁寧に途中式を書く必要はありません。答えさえ出せればOKです。
サイコロで1の目が出る確率
また、大きいサイコロ、小さいサイコロの出目の合計が5となる確率
(大,小) = (1,4), (2,3), (3,2), (4,1)
の4通りが出る確率なので、
また、平均
また、2乗の平均
(キク:35 ケコ:12)
また、
ここで、
8.さいごに(復習)
今回は、数Bの「確率分布と統計的な推測」の確率分布の基礎について説明しました。
次回は、「二項分布」について説明していきたいと思います。
下に復習コーナーを設けているので参考までにどうぞ!
(1) 平均・分散・標準偏差
ある確率変数
平均 E(X)
「それぞれの
分散 V(X)
それぞれの「(
標準偏差 σ(X)
分散
(2) 確率変数X, Y があるときの平均 / 分散 / 標準偏差
平均
分散
標準偏差(分散とほぼ同じなので覚える必要はない)
上から2番目と3番目だけを頭に入れておけばOK。それ以外は分散と基本同じ。
*1:今まで数学で出てきた
*2:というのも、「確率」の部分を難しくしてしまうと、この科目のメインディッシュである「統計的な推測」部分が誰も解けなくなってしまって意味がなくなるからです。
*3:単純に
*4:データの分析による「分散」では、最後にデータ数
*5:例えば、
*6:計算を楽にするために、それぞれの
関連広告・スポンサードリンク