F検定(等分散かどうかの検定)

F検定(等分散かどうかの検定)

 

このページでは、F検定について解説します。

 

F検定は2群の差の検定を行う前の、2群の母集団が等分散であるどうかを判定する検定です。
(F検定を行う必要があるかどうかは、こちらの2群の差の検定フローを参考にしてみてください。)

 

母集団が等分散かどうかとは、母集団の分散が等しいかどうかと意味です。

 

2群のデータの分布をグラフにした場合、形が似ているかどうかに対応するとも言えるでしょう。

 

 

 

F検定の原理と簡易例

 

F値は2つの母集団のχ2値を自由度で割ったものの比です。(F分布のページにて解説しています)。

 

中でもF検定では一部式変形を加えた不偏分散の比であるF値(分子≧分母)を使用します。

 

不偏分散の比から母集団の分散の比(つまり分散が等しいかどうか)を検討する手法がF検定です
(等分散であるほど比が1に近づきます)。

 

検定の流れに沿って、検定を行います。

 

@帰無仮説を2群の母集団に差はない(つまり同じである)とします。

 

A等分散かどうかを検定したいので、F値を検討します。ここで@にて2群の母集団に差はないと仮定しているため、こちらで記載した不偏分散の比であるF値を使用することが出来ます。ある標本データの不偏分散の比のF値が5となったとします。

 

B5%水準(上側)として判定するとします。そして、F.INV.RT関数より上側確率5%に対応するF値を算出します(F分布表を見て頂いてもOKです)。 

 

例えば、自由度が分子:3、分母:7であるとすると、4.35という値が限界値です。

 

C限界値4.35に対して、実際の算出値が5となったため、帰無仮説は棄却され、2群の母集団に差はある
 ことになります。

 

 
また、t検定だけでなくTukey法を始めとした多重比較法を行う場合でも等分散かどうかを確認しておかなければいけない方法も多々ありますので、F検定についてきちんと理解しましょう。

 

関連記事

 

F分布とは?
統計的検定の流れの概要
対応の無い場合の一元配置の分散分析とは?
対応のある場合の一元配置の分散分析とは?
F検定を分析ツールを使用せずに行う方法
繰り返しの無い場合の二元配置分散分析とは?
F.INV.RT関数(Excel)より上側確率に対応するF値を算出する方法
Tukey法を始めとした多重比較法

 

ExcelでF検定を行ってみよう!

Excelデータ分析ツールを用いて、下記データで2群の差の検定(t検定)の前のF検定を行ってみましょう。

 

ある学校のクラスAとクラスBの体重のデータを得たとします。
 
 
(※データは架空のものです)

 

データに対応が無いため、F検定(等分散かどうかの検定)を行います
(データの対応有無の判断はこちらで解説しています)。

 

@データ分析ツールを起動させ、F検定を選びます
(データ分析ツールの起動方法はこちらで解説しています。)

 

A下記のよう、入力してきます。

 

・変数1の入力範囲:クラスAの生徒の体重と記載部の下、60と記載部〜同列最下部の48まで
(クラスAの生徒の体重がラベルに対応し、ここから入力範囲を選んだ場合はラベルにチェックを入れます)
(今回は入れていません)

 

・変数2の入力範囲:クラスBの生徒の体重と記載部の下、30と記載部〜同列最下部の25まで
(クラスBの生徒の体重がラベルに対応し、ここから入力範囲を選んだ場合はラベルにチェックを入れます)
(今回は入れていません)

 

・σ:0.05は有意水準を表します。今回は5%有意水準(F検定なので片側検定)で検定しています。

 

・出力オプション:出力したい場所を選択しましょう。今回は新規のワークシートに出力しています。

 

 

 

すると以下のような結果が出力されます。

 

 

 

 

結果を判定してみよう!

 

結果の判定はいくつかの方法で行えます。

 

@まずは、F検定の原理で解説した有意水準5%のF値の限界値と実際のF値(不偏分散の比)を比較する方法で判定してみましょう。
 
・F 境界値と記載の値が、今回指定した有意水準5%でのF値の限界値です。
 (F.INV.RT関数(Excel)より上側確率に対応するF値を算出する方法により上側確率0.05,分子の自由度9,分母の自由度9から一致していることを確認してみましょう)

 

・実際のF値(不偏分散の比)は結果の観測された分散比として出力されます。今回は9.61...となります。

 

・よって、9.61>3.18となるので、帰無仮説は棄却、2つの母集団は等分散でないという判断になります。
 
 
A次にP(F<=f)に着目する方法で判定してみましょう。

 

・とてもシンプルな判定です。
P値0.001211<0.05であり、今回の結果は棄却域に入っている、つまり帰無仮説が棄却され、2つの母集団は等分散でないという判断ができます。

 

 

 

注意すること

 

今回のデータでは、クラスAの生徒の体重の分散の方がが大きかったため、分子≧分母となるF値本来の定義に従っていたので、問題ありませんでした。

 

しかし、クラスAとBのデータを列を逆にして、変数1,2の入力範囲を指定すると下記のような結果が出力されます。

 

@有意水準5%のF値の限界値と実際のF値(不偏分散の比)を比較では、有意水準を超えておらず、棄却されない結果が出てしまいます。
 
これはF値の定義:分子≧分母となるようExcelが自動で調整してくれないためです。
 
よって、上記のようなデータになりましたら、変数1の分散が大きくなるよう入れ替えたり、調整しましょう。
 

 

Aしかし、P値は同じ値を取っています。これはExcelが分子、分母の大きさも考量した判定を行ってくれているためです。
 

等分散でないという判定が出たため、さらに2群の差を検定したい場合は、等分散でない場合のt検定を行っていきます。
 

 

関連記事
統計的検定の概要
2群の差の検定(t検定)と検定フロー
等分散でない場合のt検定(ウェルチの検定)
片側検定と両側検定の違い
F検定を分析ツールを使用せずに行う方法
繰り返しの無い場合の二元配置分散分析とは?
F.INV.RT関数(Excel)より上側確率に対応するF値を算出する方法
Tukey法を始めとした多重比較法

 

ExcelでF検定を行ってみよう(その2)!

上の例では、等分散でない結果が出ましたので、等分散となる時のデータ例、結果例も載せてみます。

 

F検定の手順は上の例の通りです。

 

ある学校のクラスCとクラスDの体重のデータを得たとします。
 

(※データは架空のものです)

 

F検定の結果は以下の通りとなりました。

 

 

 

@まずは、F検定の原理で解説した有意水準5%のF値の限界値と実際のF値(不偏分散の比)を比較する方法で判定してみましょう。

 

・F 境界値と記載の値が、今回指定した有意水準5%でのF値の限界値です。

 

・実際のF値(不偏分散の比)は結果の観測された分散比として出力されます。今回は1.28...2群の不偏分散がかなり近い値であると言えます。

 

・よって、1.28<3.18となるので、帰無仮説は受容、2つの母集団は等分散であるという判断になります。

 

A次にP(F<=f)に着目する方法で判定してみましょう。

 

0.05<0.359...ですので、有意水準を超えている、つまり帰無仮説の受容で、@と同様に等分散であると判断できます。

 

 

関連記事

統計的検定の概要

2群の差の検定(t検定)と検定フロー

等分散でない場合のt検定(ウェルチの検定)

片側検定と両側検定の違い
F検定を分析ツールを使用せずに行う方法
繰り返しの無い場合の二元配置分散分析とは?
F.INV.RT関数(Excel)より上側確率に対応するF値を算出する方法
Tukey法を始めとした多重比較法

 

 


【統計処理代行】行っています


統計学や統計解析の本などは多々ありますが、実際にその統計解析が正しいのかどうかがわからないことがないでしょうか?


例えば、標準偏差を求めるときにSTDEV関数やSTDEV.S関数、STDEV.P関数など似たようなものがあったり、統計的検定を行う場合は等分散を仮定したtt検定であったり等分散を仮定しないt検定があったり等々。
そのような【統計処理を代わりに行ってほしい方々のため】に当サイト管理人であるYCが【統計解析代行】を行っています。


概要は以下の通りですので、興味ある方はお気軽にご連絡ください。


お問い合わせはこちらにお願いいたします。



【統計処理代行の概要】


・データの標準偏差、分散等の統計的基礎量の算出


・信頼区間の算出(点推定や区間推定)


・データに相関があるかどうかの判断のための相関分析


・多変量解析の代表である重回帰分析を始めとした回帰分析


・統計において非常に重要な位置付けである2群の有意差の検定(F検定やt検定等)


・二元配置分散分析を始めとした分散分析


・その他統計処理を行う前のExcel関数を使用したデータの整理


等、対応が可能です。


Excelにて統計解析を行うため、データをExcelにてご送付いただけましたら、幸いです。


また、対応可能かどうかを確認させて頂いた上でのやりとりさせて頂きたく、まずはこちらにご一報ください


F検定(等分散かどうかの検定) 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法

HOME プロフィール お問い合わせ