χ2分布

χ2分布

 

このページでは、χ2分布について解説します。

 

xと似たこのギリシャ文字χは「カイ」と呼び、χ2を「カイ二乗」と呼びます。

 

χ2値を横軸に確率変数、縦軸に確率密度を取った分布がχ2分布であり、検定を行うための分布の一つです。

 

 

χ2分布

 

ある標本データの値がa,b,c,d,eである場合、本来のχ2値の定義は、

 

χ2値=a2+b2+・・・e2 と各々の値の2乗の和のことを指します。

 

比べる標本によりデータ数が大きく異なる場合があったり、単位が統一されていない場合等があるため、各々のχ2 値をそのまま比較することが難しいです。

 

そこで、各データを比較できるようにするため、標準正規分布に従うz値を用いた場合のχ2 値を考えていきます。

 

まず、z値は以下の通りです。(z値についてはこちらで詳細を解説しています)

 

 

 

標本データがz値に従うことを仮定しているため、データ数がnであるχ2値はn個のz値を二乗して足し合わせたものであり、下記の通りとなります。χ2値の右下のnは自由度(つまりこの場合はデータ数)を表しています。

 

 

横軸にχ2値、縦軸に確率密度を取り、グラフを作成すると以下のようになります。
これがχ2分布です。

 

 

 

自由度(上記の場合はデータ数)が高いほど、足す項が増えるため大きなχ2値を取る確率は上がります。また、二乗したものの和であるため正の値のみを取ります。分布は自由度のみで変化します。

 

また、この分布を用いて、各種検定を行うことをχ2検定と呼びます(統計的検定の概要はこちらで解説しています)。

 

χ2検定の具体例やχ2値を用いた区間推定はこちらで解説しています。

 

 

Excelでχ2分布を作成してみよう!

 

Excelで理論的なχ2値を表す場合はCHISQ.DIST関数を使用します。
 
@χ2分布の横軸となるχ2値を0〜30の範囲で0.1刻み程度で作ります。(範囲や刻む値は自由度により適宜変更してください)

 

A次にχ2値に対応する確率密度を入力します。

 

 =CHISQ.DIST(対応するχ2値(下図ではAH8), 自由度, FALSE - 確率密度関数)を下図のよう、入力します。

 

B作成したχ2値範囲すべてに対応する確率を計算し、グラフを作成すれば完成です!
上図のよう、自由度をいくつか変化させると違いが良くわかります。

 

 

χ2値と不偏分散の関係

χ2値は下記のよう、不偏分散と重要な関係を持ちます。

 


不偏分散は標本から算出でき、χ2値は分布するため信頼区間を定めることで範囲を限定できます。
つまり、χ2値と上の関係式より母分散の信頼区間も算出できるのです。とても便利ですね。
(不偏分散はこちらで解説しています)

 

また、ここで使用するχ2値の係数がn-1となっています。これは下式のよう、私たちが実験やアンケートを行った際に得られるデータは小規模(n:50以下程度)であるため、母平均でなく標本平均を用いるしかないためです。不偏統計量の標本平均を使うため、自由度がn-1となり、係数n-1のχ2値を使う流れとなっています。

 

また、σ:母標準偏差をそのまま残してあるのは未知であることに加え、上述の関係式を導くためです。

 


 
それでは簡単にχ2分布から母分散の区間推定を行ってみましょう。χ2値と不偏分散の関係式は以下のように変形できます。この上限、下限とは信頼区間を決めた際のχ2値の限界値のことを指します。



上に載せました自由度5のグラフを元に考えていきます。χ2分布表より信頼区間95%のχ2値は下限:0.831、上限:12.833となります(下図イメージの通り。χ2分布表はこちらに記載しています)。

 

この値と標本データから算出した不偏分散の値を計算すれば、母分散、母標準偏差がわかる便利な方法です。

 

 

 


【統計処理代行】行っています


統計学や統計解析の本などは多々ありますが、実際にその統計解析が正しいのかどうかがわからないことがないでしょうか?


例えば、標準偏差を求めるときにSTDEV関数やSTDEV.S関数、STDEV.P関数など似たようなものがあったり、統計的検定を行う場合は等分散を仮定したtt検定であったり等分散を仮定しないt検定があったり等々。
そのような【統計処理を代わりに行ってほしい方々のため】に当サイト管理人であるYCが【統計解析代行】を行っています。


概要は以下の通りですので、興味ある方はお気軽にご連絡ください。


お問い合わせはこちらにお願いいたします。



【統計処理代行の概要】


・データの標準偏差、分散等の統計的基礎量の算出


・信頼区間の算出(点推定や区間推定)


・データに相関があるかどうかの判断のための相関分析


・多変量解析の代表である重回帰分析を始めとした回帰分析


・統計において非常に重要な位置付けである2群の有意差の検定(F検定やt検定等)


・二元配置分散分析を始めとした分散分析


・その他統計処理を行う前のExcel関数を使用したデータの整理


等、対応が可能です。


Excelにて統計解析を行うため、データをExcelにてご送付いただけましたら、幸いです。


また、対応可能かどうかを確認させて頂いた上でのやりとりさせて頂きたく、まずはこちらにご一報ください


χ2分布 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法

HOME プロフィール お問い合わせ