
スポンサードリンク
今回から3回に分けて、統計学や確率・統計でよく出てくる分布の1つである「カイ2乗分布」について勉強していきましょう。
カイ2乗分布は、
- 母分散の区間推定
- 適合度の検定
- 独立性の検定
などに使える道具であり、確率・統計の期末試験や統計検定(2級以上)で頻出の項目です。
カイ2乗分布の1回目では、カイ2乗分布の定義を説明した後、母分散を推定できる仕組みについて見ていきます。
目次 [hide]
スポンサードリンク
1. カイ2乗分布の定義
最初に、カイ2乗分布の定義を確認していきましょう。
まず、このように標準正規分布に従う確率変数
取り出した

標準正規分布に従う独立な確率変数
※ 2乗したものの和を取っているため、
スポンサードリンク
2. カイ2乗分布表の使い方
カイ2乗分布を用いて推定や仮説検定をする際には、t分布や正規分布のときと同じように専用の表(カイ2乗分布表)を使用します。
しかし、t分布や正規分布のときとは異なり、カイ2乗分布表を使う際には2点ほど注意するべきポイントがあります。
ここでは、その2つのポイントを紹介していきます。
例題、練習問題を解く際にお使いください。
注意点1. グラフが左右対称ではない
カイ2乗分布のグラフは、正規分布やt分布のように左右対称ではありません。

そのため、カイ2乗分布を用いた区間推定や両側検定をする際には、2つの値(上側の点、下側の点)を確認する必要があります[1]正規分布やt分布では、左右対称という性質を利用することで、片方の値を求めればその値をもう片方に適用することが出来ました。。

下側の点
※ 上側、下側は上位、下位みたいなものだと思ってください。例えば、上側5%の点というのは、ある値が上位5%に属するときの値を指しています。
※ 実際に区間推定や両側検定をする際に、再度詳細を詳しく説明します。
注意点2. 自由度によってグラフの概形が変わる
カイ2乗分布のグラフは、自由度によってグラフの概形が変化します。(t分布と同じ)

そのため、カイ2乗分布表を使用する際には、t分布のときと同じように自由度も併せて把握する必要があります。
カイ2乗分布表の読み方
では、実際にカイ2乗分布表を読んでみましょう。
例えば、自由度が5、上側5%点(=カイ2乗値が上位5%となるときの値)をカイ2乗分布表から読み取ってみましょう。
読み取る際には、自由度

すると、11.070と読み取れますね。つまり、自由度が5のとき、カイ2乗値が上位5%となるときの値は11.070であることが分かります。
スポンサードリンク
3. カイ2乗分布を用いて母分散推定が出来る仕組み
カイ2乗分布を使うことで、次の式での母分散
信頼度
【変数の意味】
… 標本サイズ(データの数) … 不偏分散 … 上側 %点(下側 %点)でのカイ2乗値(カイ2乗分布表から読み取る) … 上側 % 点でのカイ2乗値(カイ2乗分布表から読み取る)

※ 補足
標本分散
この章では、上の公式が実際にどのように導出されるかを見ていきましょう。
※ 導出なんてどうでもいい、実際に母分散推定練習がしたい!という人は4章まで飛ばしてください。
手順1.正規分布に従う標本の用意
まず、正規分布(平均:
手順2.正規分布から標準正規分布への変換確認
正規分布(平均:
しかし、平均:
つまり、正規分布(平均:
手順3.不偏分散の計算式確認
手順4. 手順3の式を変形
ここからは、手順3の式
この形から、
※ 変形時に、
手順5. カイ2乗分布が成り立つ形にする
手順4で、
この式の両辺を
ここで、右辺の
また、
は、平均 、分散 の正規分布に従っている(=中心極限定理)- 以下の式
は、平均1、分散0の標準正規分布に標準化している。 - 標準化した標準正規分布を2乗している
よって、右辺が「標準正規分布を2乗したもの」の和の形になっているため、左辺
手順6. 自由度の確認
手順5で導出したカイ2乗分布に従う以下の式の、自由度を確認します。
手順5の式の左辺で出てきた
しかし、桃色部分に標本平均
よって、
手順6. 母分散
あとは、信頼区間に対応する下側の点
ここで、この不等式を
つぎに、各不等式の両辺を
さらに、
あとは、この2式を合わせて
4. 例題にチャレンジ
では、実際に母分散の推定をする問題を、例題で解いてみましょう。
正規母集団から10個の標本を抽出したところ、標本平均が64、不偏分散が36であった。
このとき、信頼度95%で母分散を区間推定しなさい。区間推定の結果は、小数第2位まで示すこと。
解説.
Step1. 自由度を確認する
今回は、10個の標本を抽出(=標本サイズが10)なので、自由度は 10 - 1 = 9 となります。
Step2. カイ2乗分布から値を読み取る
今回は、信頼度95%の推定を実施するため、下の図のように分布の中心から両端に合計95%の確率が含まれるようにします。

ここで、分布の中心から両端に取った薄い灰色部分の面積は95%なので、残りの5%は半分(2.5%)ずつ上側2.5%と下側2.5%に分けられます。
さらに、上側97.5%(=下側2.5%)部分のカイ2乗値の境界値を

カイ2乗分布表は、上側確率
… 上側97.5%、自由度9。つまり , … 上側2.5%、自由度9。つまり ,

実際に表から読みってみましょう。

結果、
Step3. 区間推定の公式に代入
あとは、標本サイズ
実際に代入すると、
5. 練習問題で確認!
最後に、練習問題を解くことで母分散の区間推定の復習をしましょう。
※ 練習問題のデータは、「うさぎでもわかる確率・統計 t分布のいろは① 母平均の推定」の練習問題と同じものを使っています。
ある中学生の1年生全体が対象の、数学の期末テストが行われた。その中で、特定の塾に通っている4人(佐藤くん、西尾くん、池田さん、竹本さん)の期末テストの点数は、次の通りだった。
佐藤くん | 西尾くん | 池田さん | 竹本さん | |
---|---|---|---|---|
期末テストの点数 | 72 | 60 | 84 | 76 |
(1) 4人のテスト結果の平均点、および不偏分散を求めなさい。
(2) この4人のテスト結果から、1年生全体の数学の点数の母分散を信頼度90%で区間推定しなさい。
6. 練習問題の答え
(1)
標本の平均
計算ミスを減らすテクニックとして、いったん
不偏分散
(2)
Step1. 自由度の確認
今回は、4個の標本を抽出(=標本サイズが4)なので、自由度は 4 - 1 = 3 となります。
Step2. カイ2乗分布から値を読み取る
信頼度90%の推定を実施するため、下の図のように分布の中心から両端に合計90%の確率が含まれるようにします。

分布の中心から両端に取った薄い灰色部分の面積は90%なので、残りの10%は半分(5%)ずつ上側5%と下側5%に分けられます。

ここで、下側5%(=上側95%)部分のカイ2乗値の境界値を

あとは、
… 上側95.0%、自由度3。つまり , … 上側5.0%、自由度3。つまり ,
実際に表から読みってみましょう。

結果、
Step3. 区間推定の公式に代入
あとは、標本サイズ
代入すると、
※ 標本サイズが小さいと、信頼区間の幅がかなり大きくなりますね。
関連広告・スポンサードリンク