数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
あるデータを直線補間する場合には単回帰分析と呼ばれる単回帰式(結果に対する要因が一つの場合)とよばれる直線に基づいた予想を行うことで対応でき、Excelにて行う場合はForecast関数を使用し予想を行います。
同様に、結果に対する要因が複数の場合の予想を行うためには重回帰分析と呼ばれる解析方法を用いて、予想を行います。
定量的なデータに対してExcel関数を用いて重回帰分析を行う場合はTrend関数を使用し予想を行うことができ、また分析ツールを使用した定量的なデータの重回帰分析は別ページにて解説しています。
定量的なデータだけでなく、定性的なデータ(質的データ)に対しても、重回帰分析を行うことができ、定性的なデータの重回帰分析のことを数量化I類と呼びます。
(重回帰分析では、@どのパラメータが結果に影響を与えているかを表す「影響度」やA結果がどうなるかという「予測」の解析ができます。)
こちらのページでは数量化I類に関する以下のテーマで解説しています。
・Excel分析ツールを使用して定性的なデータの重回帰分析(数量化I類)を行ってみよう
というテーマで解説しています。
Excelで定性的なデータの重回帰分析を行ってみよう
私が好きなラーメンのデータ(架空です)を用いて、どの要因が結果(好きかどうか)に影響を与えているか、どの因子を選ぶとより好きになるか(予測)を考えていきましょう。
ここで以下の田口メソッドと呼ばれる品質工学で有名な田口氏により開発された、タグチの直交計画表(実際の直交計画表を改良したものを用いています(別ページで解説していきます)。
下記のスープの味、スープの濃さ、麺の太さを要因とします。
また、好きかどうかの項目(結果)は堅い表現では被説明変数などとと呼びます。
こちらのページでは単純に結果と呼ぶことにします。
Excelを用いて、下表のように横軸に要因と結果を入力し、各要因(スープの味等)の中の各水準(とんこつ等)が当てはまる場合、変数として1を入れ(ダミー変数と呼びます)、結果では大好きを2、好きを1、普通を0とします。
ここでスープの味は3種類ありますが、2種類の1か0が定まったら残りの1種類は自動的に決まりますよね?
(とんこつでもみそでもない→醤油という具合に)
重回帰分析は、なくても良い情報を載せると多重性の問題からExcelデータ解析時に本来の値と異なってしまうため気をつけましょう。
よって、各要因において基準となる一水準の列の削ります。
Excelデータ分析で回帰分析をクリックし、下記のよう入力範囲を選びます。
(とんこつ等の水準や結果と記載部の行がラベルに対応します。
ここから入力範囲を選んだ場合は、ラベルにチェックを入れます)(今回は入れてみました)
すると以下の結果が出力されます。
ここで、着目すべきいくつかのパラメータがあります。
@補正R^2(自由度修正済み決定係数):信頼度を判断します。1に近づくほど高く、時と場合によりますが、0.7より高ければ信頼性ありとして問題ないでしょう。
A係数:予測式も影響度もこの値を用いて算出します。
予測式(回帰式と呼びます)を算出しましょう。
係数に着目すると、先ほど削除した列以外のパラメータの値が載っています。これは削除した行を基準(0)として、その値が正であれば基準としたパラメータよりも結果の値が高くなる方(今回は大好き)に近づくことを示しています。
よって、予測式(回帰式)は以下の通りになります。
選んだ項目に対応する係数を足すと、大好きなら2へ好きなら1へ普通なら0に近づきます(ただしRが低い場合は当てはまらない場合が増えていきます)。
例えば、スープの味がとんこつで濃さが普通、麺の太さが細い場合は、y=-0.44+0.44+0.56+0=0.56となり、普通から好きの間程度の満足度になるという予想が立てられます。
さらに影響度は、各種類のレンジ(範囲)から算出します。(各種類の大きい係数から、小さい係数を引く)
するとスープの味0.44、スープの濃さ1.44、麺の太さ0.44となり、スープの濃さが結果(大好きかどうか)に最も影響を与えていることがデータから読み取れます。
関連記事
Forecast関数とは?使用方法は?
Forecast関数の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
【統計処理代行】行っています
統計学や統計解析の本などは多々ありますが、実際にその統計解析が正しいのかどうかがわからないことがないでしょうか?
例えば、標準偏差を求めるときにSTDEV関数やSTDEV.S関数、STDEV.P関数など似たようなものがあったり、統計的検定を行う場合は等分散を仮定したtt検定であったり等分散を仮定しないt検定があったり等々。
そのような【統計処理を代わりに行ってほしい方々のため】に当サイト管理人であるYCが【統計解析代行】を行っています。
概要は以下の通りですので、興味ある方はお気軽にご連絡ください。
【統計処理代行の概要】
・データの標準偏差、分散等の統計的基礎量の算出
・信頼区間の算出(点推定や区間推定)
・データに相関があるかどうかの判断のための相関分析
・多変量解析の代表である重回帰分析を始めとした回帰分析
・統計において非常に重要な位置付けである2群の有意差の検定(F検定やt検定等)
・二元配置分散分析を始めとした分散分析
・その他統計処理を行う前のExcel関数を使用したデータの整理
等、対応が可能です。
Excelにて統計解析を行うため、データをExcelにてご送付いただけましたら、幸いです。
また、対応可能かどうかを確認させて頂いた上でのやりとりさせて頂きたく、まずはこちらにご一報ください
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう 関連ページ
- Excelデータ分析ツール使用の前準備
- 度数分布表とヒストグラム
- 【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
- 【Excel】平均とは?2 (幾何平均、移動平均)
- 【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
- 標本と母集団
- 信頼区間の推定
- 信頼区間の推定をExcelを用いて行ってみよう!
- 【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
- 二項分布
- 【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
- 【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
- 正規分布の応用技術(自動運転車におけるAI)
- 推測統計学とt分布
- χ2分布
- 【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
- 【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
- F分布
- 統計的検定の概要
- 2群の差の検定(t検定)と検定フロー
- F検定(等分散かどうかの検定)
- F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
- Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
- Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
- 等分散の時のt検定
- 等分散でない時のt検定(ウェルチの検定)
- パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
- ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
- マン・ホイットニーのU検定
- 【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
- 【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
- 【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
- 【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
- 【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
- 参考文献
- 【Excel】関数を使わずにデータを間引く方法
- 【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
- 【Excel】関数を使わずにn行ずつ空欄を追加する方法
- 【Excel】数字の間にハイフンを一括して入れる方法
- 【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
- 【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
- 【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
- 【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
- 【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
- 【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
- 【Excel】Vlookup関数の使用方法
- 【Excel】STDEV関数とSTDEVP関数の違い
- 【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
- 【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
- 【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
- 【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
- 【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
- 両側検定と片側検定の違い
- 分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
- 分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
- 分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
- 多重比較法とは?分散分析との違い Tukeyの方法
- 重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
- 【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
- 【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
- 多変量解析 主成分分析と因子分析とは?違いは?
- 実験計画法