
スポンサードリンク
こんにちは、ももやまです。
今回は、数Bの「確率分布と統計的な推測」に出てくる標本調査について、そして「確率・統計」分野で重要な中心極限定理について説明していきたいと思います。
今回の範囲は、共通テスト(センター試験)で直接的に聞かれることは少ないですが、次回説明する「母平均の推定」で必要な知識となるので、頭にいれておきましょう。
前回の「うさぎでもわかる確率分布と統計的な推測」4日目はこちら↓
目次 [hide]
スポンサードリンク
1.標本調査
(1) 標本調査とは
大量のデータの情報を調べるときに、いちいち全部のデータ(母集団)を調べていたらきりがありません。
そこで、実際には全部のデータの中から何個かをランダムに*1抽出(抽出したデータのことを標本と呼びます)し、抽出したデータを調べてから母集団のデータを予測するという手法を用います。この手法のことを標本調査と呼びます。
(一方全部のデータを調べてから母集団のデータを調べる方法を全数調査と呼びます*2。)
(2) 標本調査の例
標本調査の例をいくつか紹介していきましょう。
例えば、テレビ番組の人気を示す「視聴率」がありますね。しかし、今までで「視聴率の調査、つまりどの番組を見ていましたか?」の調査を受けたことがある人はほとんどいないかと思います。
視聴率を調べるためにいちいち全国の人にアンケートをとってたらキリがないし、時間の無駄です。そのため、視聴率を調べる際には、「一部の世帯だけを偏りなく調査」する標本調査が用いられます。
他にも標本調査の例として、
- 選挙の開票速報
(一部の人からどこに投票したのかを聞き、選挙情勢を予測) - 製品などの重さ・長さチェック
(いちいち全部の製品を測っていたらキリがない)
などがあります。
余談 標本調査と測定
余談ですが、理系大学生になる人(もしくは今なっている人)は1年生の実験で、「ある物体(の重さ・長さなど)を何回か測定して」から測定結果とその誤差を計算することをするかもしれません。
実験で得る測定値は、自然科学という母集団から抽出された標本の中の1つなので、全数調査で結果を調べるためには無限回の測定が必要となってしまい、測定が終わりません。
そのため、何回か測定してから結果を予測する標本調査が用いられます。
スポンサードリンク
2.標本調査の用語
(1) 母平均・母分散・母標準偏差とは
母集団、つまり調べたい対象全体の平均、分散、標準偏差のことをそれぞれ母平均、母分散、母標準偏差と呼びます。
(平均、分散、標準偏差の計算方法は数1「データの分析」と同じです)
例えば、母集団5人の身長が 162cm, 164cm, 166cm, 168cm, 170cm だった場合の母平均
(2) 標本の大きさ・標本数
標本にあるデータの数のことを標本の大きさ(サンプルサイズ)と呼びます。
標本数(サンプル数)と呼びたくなる気持ちもわかるのですが、標本数は「標本自体の数」を表しているため、標本数と標本の大きさは別物となってしまいます。
(3) 標本平均・標本分散・標本標準偏差とは
標本(母集団からランダムに選んだいくつかのデータ)の平均、分散、標準偏差のことをそれぞれ標本平均、標本分散、標本標準偏差と呼びます。
(平均、分散、標準偏差の計算方法は数1「データの分析」と同じです)
例えば、母集団5人から3人選んだところ、身長が 162cm, 164cm, 166cm だった場合の標本平均
(今回の場合、偶然「標本分散=母分散」、「標本標準偏差=母標準偏差」が成立しています)
標本の選び方によって、標本平均、標本分散、標本標準偏差は、標本の選び方によって値が変化します。
また、「母平均 ≠ 標本平均」、「母分散 ≠ 標本分散」、「母標準偏差 ≠ 標本標準偏差」な点に注意しましょう。
おまけ:不偏分散(数B範囲外です)
数Bの範囲外なので、ここは高校生の皆さんは見なくてもOKです。
標本の選び方によって、標本分散
実は、標本分散
そこで、標本分散の公式
スポンサードリンク
3.標本平均の関係
「確率分布と統計的な推測」で重要な項目の1つに、標本平均から母平均を推定するというのがあります。
そのために必要な標本平均の関係式をここで説明していきましょう。
(1) 標本平均の平均 / 分散
標本の選び方によって、標本平均
そこで、標本平均
例題
箱の中に大量のカードが入っており、中身の 3/4 には2、1/4 には1が書かれている。
無作為に2枚のカードを取り出し、取り出したときに書かれているカードの数字を順に
このとき標本平均
解答
まず、
標本平均 |
確率 | ||
1 | 1 | 1 | |
1 | 2 | ||
2 | 1 | ||
2 | 2 | 2 |
よって、
標本平均 | 確率 |
1 | |
2 |
表より、標本平均
また、標本平均の2乗平均
(2) 標本平均の平均と母平均・標本平均の平均と母分散の関係
母平均と標本平均の平均
先程の例題のつづき
箱の中に大量のカードが入っており、中身の 3/4 には2、1/4 には1が書かれている。
このとき、カードにかかれている数字の母平均
先程の例題のつづきの解説
母集団は、箱の中にあるカードすべてである。
つまり、母平均は、箱の中にある全部のカードの数字の平均値、母分散は、箱の中にある全部のカードの数字の分散を求めればよい。
よって、母平均
ここで、無作為に2枚取り出したときの標本平均の平均
ここで、
- (標本平均の平均)=(母平均)
- (標本平均の分散)=
が成り立ちそうですね。
本当に成り立つか少し証明してみましょう。
関係式の証明(余裕ない人は飛ばしてもOK)
母平均
すると、それぞれの標本
ここで、標本平均
よって、標本平均の平均
また、標本の大きさが十分に大きいと仮定しているため、
よって、標本平均の分散
関係式の意味
標本平均
母集団の母平均を
すると、標本平均
つまり、
- 標本平均
の平均は母平均と一致する - 標本を増やせば増やすほど、標本平均の分散は小さくなる
ことがわかる。
4.中心極限定理
先程、十分に大きい母集団から大きさ
実は、標本数
言い換えると、母集団がどんな分布であっても*3、母集団から多くのデータを集めた標本の標本平均
これが中心極限定理です。
母集団の母均を
このとき、
つまり、標本の大きさ
5.(簡単に)練習問題
では、練習(共通テスト対策)をしてみましょう!
必要であればこちらから正規分布表をダウンロードし、使用してください。
※注意
小数の形で解答する場合、指定された桁数の1つ下の桁を四捨五入して解答してください。また、必要に応じて、確定された桁まで⓪をマークしてください。
例えば、[ ア ] . [ イウ ] に 2.5 と答えたいとき → 2.50 とする。
あるテストの点数の母平均は60、母分散は2500だった。
このとき、100人の生徒(標本)を無作為に選び、その標本平均を
ここで、標本の大きさ100は十分に大きいとみなせるので、
正規分布と仮定したとき、標本平均
6.練習問題の答え
生徒数(標本の大きさ)が100、母平均
また、分散
また、標準偏差
ここで、
が「平均 (60点) - 標準偏差2個分 (5×2 = 10点) 以上」 が「平均 (60点) + 標準偏差2個分 (5×2 = 10点) 以下」
となる確率、つまり
標準正規分布表から
よって、平均 〜 平均 ± 標準偏差2個分となる確率(
よって、小数第3位を四捨五入した0.95が答え(カキ:95)。
なお、実際には母集団から標本平均を推定する問題よりも、標本から母平均を推定する問題が頻出します。
7.さいごに
今回は、「確率分布と統計的な推測」の分野の中の「標本調査」と「中心極限定理」についてまとめていきました。
次回は、今回習った「標本調査」や「中心極限定理」などを生かして、実際に標本から「母平均」などを推定する方法についてまとめていきたいと思います!
(母平均の推定は共通テスト頻出項目です!)
復習(中心極限定理)
今回は中心極限定理について復習すればOKです。
母集団がどんな分布(ただし分散が0以外の)であっても、 母集団から多くのデータを集めた標本の標本平均
関連広告・スポンサードリンク