分散分析とt検定の違い

多重比較法とは? 分散分析との違い Tukeyの方法

 

2群の有意差の有無を判断する場合はt検定を行います。

 

そして、多群のデータの分析を行う、つまりある実験データなどに対していくつかの因子がそのデータに影響を与えている場合、特定の因子がデータに影響を与えたかどうかを分析する場合は、分散分析(ANOVA)を行います。

 

分散分析では、因子数やデータ対応の有無により、対応の無い場合の一元配置分散分析対応の有る場合の一元配置分散分析対応が無く繰り返しの無い、有る場合の二元配置分散分析などに分類することが出来ます。

 

ただし、分散分析においても群ごとの有意差を判定することは出来ず、多群において群ごとの有意差を判定する場合は多重比較法という方法を用います。

 

こちらのページでは、

 

・多重性とは?

 

・Turkeyの多重比較法、スチューデント化されたq分布とは?

 

・Tukeyの方法実施前の分散分析と参考値算出のためのt検定

 

・Tukeyの方法を使用する時の注意点

 

について解説しています。

 

 

多重性とは?

 

多群の分散分析において、各群ごと有意差を検定したい場合、t検定(2群の平均の差の検定)を繰り返し行うことで検定できるのではないかと考えることが出来ます。

 

じかし、実際はあるデータに対して何度も検定を繰り返すと有意差があると判断されやすくなってしまう、多重性というものの存在があり、単純にt検定を繰り返すだけでは各群の差をきちんと判定できないのです。

 

この多重性のイメージを以下に記載します。

 

当サイトのメインテーマである電池において10個に1個不良品を含んだセルがあったとします。

 

これを10個を1セットとして、各メーカーに出荷するとします。

 

A社には1セット/月出荷し、B社には4セット/月出荷するとします。

 

そして、特定のセットが不良品を含まない確率は90%であり、A社が不良品を選ばない確率は90%、B社が不良品を選ばない確率は4回連続でセットを選んだ確率と考えることができるため、0.9×0.9×0.9×0.9=0.6561と約66%となり、不良品が混ざる確率が高くなってしますのです(実際は品質工学における3σでの管理を行うため不良品を含む確率はppmオーダーと非常に低いです)

 

多重性とは、上述と同様に検定を繰り返すことにより帰無仮説の棄却領域が広がって、本当は棄却しなくて良い部分を棄却してしまう現象のことであり、この多重性を少なくするために分布を調整する必要があるのです。

 

そして、上述例ですとt検定を行う検定回数が出荷セット数に対応し、有意水準が100-90=10%(α=0.1)に当たります。

 

関連記事
 

t検定(2群の平均の差の検定)とは?
正規分布と品質工学における3σでの管理とは?
対応の無い場合の一元配置分散分析
対応の有る場合の一元配置分散分析
対応が無く繰り返しの無い、有る場合の二元配置分散分析

 

 

 

Turkeyの多重比較法、スチューデント化されたq分布とは?

 

例えば2群の平均の差を検定にかける標本データから母集団を予想した2群で検定する際は正規分布でなく、t分布を使用した場合の検定(t検定)を行いました。

 

同様に多重性を考慮する際には、上述例のように検定を繰り返した場合でも棄却域が大きくならないように調整され、調整をして各群の検定を行う方法を多重比較法と呼び、多くの手法が研究、開発されています。

 

調整方法としては①分布自体の調整 ②統計量の調整 ③有意水準の調整と大きく3つに分けられます。

 

データの大きさであったり、群の数などで採用する解析方法が変化します。

 

こちらのページでは、①分布の調整による多重比較法の代表例であるTurkeyの多重比較法と、この方法で使用するスチューデント化されたq分布における値であるq値について解説します。

 

関連記事
 

t検定(2群の平均の差の検定)とは?
正規分布と品質工学における3σでの管理とは?
t分布とは?
対応の無い場合の一元配置分散分析
対応の有る場合の一元配置分散分析
対応が無く繰り返しの無い、有る場合の二元配置分散分析

 

 

Tukeyの方法実施前の分散分析と参考値算出のためのt検定

 

まず、電池に関する下記データを入手したとします。

 

電池の抵抗[mΩ]電解液中のある成分の影響を検討するとします。

 

 

 

 

分散分析の実施

 

まず、一元配置分散分析(対応無し)にかけ、ある成分因子が電池の抵抗に影響を与えるかどうかの判断を行います。

 

 

 

すると、P値が0.05以下となったため、成分による効果があることがわかりました。

 

それでは、どこの群とどこの群に有意差があるかを確認するために、一旦t検定により判定してみましょう(実際は上述のよう多重性の問題からt検定を行ってはいけません。今回はq値との比較として参考までに実施します)

 

 

t検定の実施(参考のため)

 

次に、各群を2群の平均の差の検定(t検定)にかけていきましょう。

 

t検定のフローに従い、等分散かどうかの検定(F検定)を行った後に、t検定にかけます。
(※各検定の仕方は各ページで解説のため、過程は略しています)

 

すると、各群のF検定の結果は、すべて0.05より大きい値となったため、等分散であるという判断が出ました。

 

次に、各群のt検定におけるp値を算出しますと以下のようになりました。

 

A-B間:0.000204 → 有意差あり(0.05以下であるため)
B-C間:0.41055  → 有意差なし(0.05より大きいため)
A-C間:0.000129 → 有意差あり(0.05以下であるため)

 

となりました。

 

 

Tukeyの方法(q値の算出)

 

次に本来行うべきであるTukeyの方法について解説します。

 

上述しましたq値は以下のようにt分布におけるt値ととても似ており、全群の誤差変動を不偏分散の代わりに使用していることだけが変更点です。

 

なお、標本の大きさは異なっていても問題ないです。

 

そして、全群の誤差変動はExcel分析ツールにおける分散分析表のグループ内変動(誤差の変動)の値をそのまま使用すればOKです。

 

 

それでは、各々の群間のq値を算出していきましょう。

 

たとえばA-B間のq値を算出するためには、(19.6-27.2)/(57.2*(1/5+1/5))^0.5 *(-1)とし、最後に絶対値に直すため×-1の補正をしています。

 

同様に算出していきますと、A-B間では1.589、B-C間では1.881、A-C間では0.293となります。

 

次にq分布表から棄却限界値を算出します。q分布表より、群数3と誤差自由度(群数3×標本サイズ4-群数3=12)のところを読み取りますと3.773となり、限界のq値はこれをルート2で割った値となります。

 

 

 

この2.668を超えるq値を持つものが効果があるということが言えるのですが、今回の結果はすべてこれより小さくなったために帰無仮説が棄却されずに、どの群間でも効果があるかどうかわからないという結果になってしまいました。

 

そのくらい厳しい判定結果が出るものがこのq値を使用したTukeyの多重比較法です。

 

例えば、成分Dとして値が50,50,50,50,50というような明らかに異なるデータを分析にかければ、きちんと有意差はでます。

 

関連記事
 

電池の抵抗とは?
電解液の材料化学
t検定(2群の平均の差の検定)とは?
正規分布と品質工学における3σでの管理とは?
t分布とは?
対応の無い場合の一元配置分散分析
対応の有る場合の一元配置分散分析
対応が無く繰り返しの無い、有る場合の二元配置分散分析

 

 

 Tukeyの方法を使用する時の注意点

 

Tukeyの方法を使用する際の注意点がいくつかあり、以下の通りです。

 

・全ての群間が等分散でなければならないこと(F検定により各群の等分散をきちんと確かめましょう)

 

・データが正規分布に従っていること(通常こちらは特に問題ないと考えてよいでしょう)。
(したがっていない場合はノンパラメトリック手法により分析する必要があります)。

 

関連記事

 

 
正規分布と品質工学における3σでの管理とは?
F検定(等分散かどうかの検定)

 

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

 

 

多重比較法とは?分散分析との違い Tukeyの方法 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】-(ハイフン)を入力した郵便番号の-を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square)を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!

HOME プロフィール お問い合わせ