数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう

数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう

 

あるデータを直線補間する場合には単回帰分析と呼ばれる単回帰式(結果に対する要因が一つの場合)とよばれる直線に基づいた予想を行うことで対応でき、Excelにて行う場合はForecast関数を使用し予想を行います

 

同様に、結果に対する要因が複数の場合の予想を行うためには重回帰分析と呼ばれる解析方法を用いて、予想を行います。

 

定量的なデータに対してExcel関数を用いて重回帰分析を行う場合はTrend関数を使用し予想を行うことができ、また分析ツールを使用した定量的なデータの重回帰分析は別ページにて解説しています。

 

定量的なデータだけでなく、定性的なデータ(質的データ)に対しても、重回帰分析を行うことができ、定性的なデータの重回帰分析のことを数量化I類と呼びます。
(重回帰分析では、①どのパラメータが結果に影響を与えているかを表す「影響度」や②結果がどうなるかという「予測」の解析ができます。)

 

 

こちらのページでは数量化I類に関する以下のテーマで解説しています。

 

・Excel分析ツールを使用して定性的なデータの重回帰分析(数量化I類)を行ってみよう

 

というテーマで解説しています。

 

 

Excelで定性的なデータの重回帰分析を行ってみよう

私が好きなラーメンのデータ(架空です)を用いて、どの要因が結果(好きかどうか)に影響を与えているか、どの因子を選ぶとより好きになるか(予測)を考えていきましょう。

 

ここで以下の田口メソッドと呼ばれる品質工学で有名な田口氏により開発された、タグチの直交計画表(実際の直交計画表を改良したものを用いています(別ページで解説していきます)。

 

下記のスープの味、スープの濃さ、麺の太さを要因とします。

 

また、好きかどうかの項目(結果)は堅い表現では被説明変数などとと呼びます。

 

こちらのページでは単純に結果と呼ぶことにします。
 
 

 

Excelを用いて、下表のように横軸に要因と結果を入力し、各要因(スープの味等)の中の各水準(とんこつ等)が当てはまる場合、変数として1を入れ(ダミー変数と呼びます)、結果では大好きを2、好きを1、普通を0とします。
 
 
 
ここでスープの味は3種類ありますが、2種類の1か0が定まったら残りの1種類は自動的に決まりますよね?
(とんこつでもみそでもない→醤油という具合に)

 

重回帰分析は、なくても良い情報を載せると多重性の問題からExcelデータ解析時に本来の値と異なってしまうため気をつけましょう。

 

よって、各要因において基準となる一水準の列の削ります。
 
 

 

Excelデータ分析で回帰分析をクリックし、下記のよう入力範囲を選びます。
(とんこつ等の水準や結果と記載部の行がラベルに対応します。
ここから入力範囲を選んだ場合は、ラベルにチェックを入れます)(今回は入れてみました)

 

 

 

 

すると以下の結果が出力されます。
 

 

ここで、着目すべきいくつかのパラメータがあります。

 

①補正R^2(自由度修正済み決定係数):信頼度を判断します。1に近づくほど高く、時と場合によりますが、0.7より高ければ信頼性ありとして問題ないでしょう。

 

②係数:予測式も影響度もこの値を用いて算出します。

 

予測式(回帰式と呼びます)を算出しましょう。

 

係数に着目すると、先ほど削除した列以外のパラメータの値が載っています。これは削除した行を基準(0)として、その値が正であれば基準としたパラメータよりも結果の値が高くなる方(今回は大好き)に近づくことを示しています。

 

よって、予測式(回帰式)は以下の通りになります。
選んだ項目に対応する係数を足すと、大好きなら2へ好きなら1へ普通なら0に近づきます(ただしRが低い場合は当てはまらない場合が増えていきます)。

 

 

例えば、スープの味がとんこつで濃さが普通、麺の太さが細い場合は、y=-0.44+0.44+0.56+0=0.56となり、普通から好きの間程度の満足度になるという予想が立てられます

 

 

さらに影響度は、各種類のレンジ(範囲)から算出します。(各種類の大きい係数から、小さい係数を引く)

 

するとスープの味0.44、スープの濃さ1.44、麺の太さ0.44となり、スープの濃さが結果(大好きかどうか)に最も影響を与えていることがデータから読み取れます。

 

 
 

 

関連記事

 

Forecast関数とは?使用方法は?
Forecast関数の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法

 

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2(カイ二乗)分布とは
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】-(ハイフン)を入力した郵便番号の-を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square:二乗平均平方根)と標準偏差の違いは?RMSの計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数(STDEV.S関数)とSTDEVP関数の違い
【Excel】VAR関数(VAR.S関数)とVARP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
【Excel】非表示列や行の再表示を一括で行う方法
【Excel】文の先頭に同じ文字列を一括で追加する方法【一括で追加】
対数の変換における2.303とは?常用対数と自然対数の変換
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!
【Excel】アークサインsin-1・アークコサインcos-1・アークタンジェントtan-1の計算方法【Excel】
材料証明書とミルシートの違い
【Excel】折れ線グラフで途中から点線にする方法
【Excel】折れ線グラフで途中の一部を消す方法
【Excel】折れ線グラフで途中から色を変える方法【色分け】
【Excel】数値の末尾に0を表示させ有効数字をそろえる方法
【Excel】円グラフで並び替えを行う方法【大きい順・小さい順】
【Excel】RANK関数を使用して数値の抽出・順位づけを行ってみよう
【Excel】エクセルを使用して割合や構成比を求める方法
【Excel】エクセルで文字を丸囲みする方法
【Excel】エクセルで必要ないスペースを一括で削除する方法
【Excel】エクセルで上付き文字と下付き文字を同時で行う方法
【Excel】エクセルでレ点(チェックマーク)を入力・編集・削除する方法
【Excel】「どっちが安いか」を計算する方法【値段の比較】
【Excel】前年比・伸び率・増減率(増加率・減少率)を計算する方法
【Excel】工場や施設の稼働率の定義と計算方法【演習問題】
【Excel】比率の計算方法(x:yに分ける方法)
【Excel】倍率の計算方法【入試の倍率・競争倍率】
【Excel】エクセルにおいて可視セルのみをコピーする方法
【Excel】途中で切れている折れ線グラフをつなげる方法【データ要素を線で結ぶ】
【Excel】利益と粗利の違い 利益率(粗利率)を計算する方法
【Excel】エクセルでセルに色を付けると枠線が消えるときの対処方法

HOME プロフィール お問い合わせ