【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】

【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう【演習問題】

 

科学データを解析する際に、相関分析を回帰分析などを行う場合が良くあります。

 

これらの解析を行う際に共分散と呼ばれるパラメータを含んでいる場合があり、こちらのページでは共分散に関する以下のテーマで解説しています。

 

・共分散とは何か?共分散の定義は?

 

・Excel関数(COVAR関数、COVARIAN.P関数)を使用して相関係数を算出してみよう

 

・Excel分析ツールを用いて共分散を求めてみよう

 

・Excel関数、分析ツールを使用せずに共分散を求めてみよう

 

というテーマで解説しています。

 

 

共分散とは何か?共分散の定義は?

共分散とは、一言で説明しますとある二つのデータ(結果)における規格化されていない相関係数のようなものと言えます

 

つまり、共分散が大きい場合、片方のデータが大きくなるともう片方のデータが大きくなり、共分散が小さい場合、片方のデータが大きくなるともう片方のデータが小さくなり、0に近いと各々のデータの関連性が低いと言えます。

 

ただし、共分散ではデータの値により、その値が大きく変わり、例えば桁数が大きく異なるデータを使用するとその分桁数が大きい共分散が現れやすくなるため、データによって比較ができません。

 

そのために規格化する(-1~1の範囲に収める)ことで各データを比較することが出来るようになり、上述のように規格化したものが相関係数です。

 

相関係数rにおいてはこの値が-1≦r≦1となり、1に近いほど正の相関があり-1に近いほど負の相関があり、0に近いほど関連性が低くなると、共分散と似ていることがわかります。

 

そして、共分散の定義式は以下の通りです。

 

ここでの共分散とは母集団、もしくはある標本データそのものの共分散の定義式であり、標本から母集団の共分散を推定する不偏共分散でないため気を付けましょう。

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化Ⅰ類とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?

 

 

Excel関数(COVAR関数、COVARIENCE.P関数)を使用して共分散を算出してみよう

上の定義式を自動で計算してくれるExcel関数があり、これを用いて共分散(英語でcovarience)を算出してみましょう。

 

COVAR関数とCOVARIENCE.P関数と呼ばれる関数を使用します。

 

どちらも同じ処理を行います。

 

当サイトのメインテーマでもあるリチウムイオン電池の容量と質量の関係の表した以下のデータを得たとします。このデータの共分散を算出してみましょう。

 

=COVAR(xの範囲,yの範囲)と指定することで算出できます(もしくは=COVARIENCE.P関数)。

 

 

 

すると7332.5となり、0から大きいため共分散は大きいと考えられると判断できます。

 

判断できますと記載したのは使用するデータの値がさらに値が大きい場合、0から離れていた値をとっていたとしても、規格化した場合(相関係数で考えると)だと比較的0に近くなる場合があるからです。

 

なお、このデータの相関係数は0.995となるため、共分散も大きいと判断してよいです。

 

散布図と照らし合わせますと直感的に理解できます。

 

 

同様にExcel分析ツールを使用しても算出することが出来ます。

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化Ⅰ類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?

 

COVARIENCE.P関数とCOVARIENCE.S関数の違いは?

STDEV関数とSTDEVP関数の違いでも解説させて頂きましたが、標本データそのものや母集団のデータそのものの標準偏差や共分散などの統計的データを算出する際に、データ数(自由度n)で割る項を含んでいました。

 

これに対して、標本から母集団を予測する場合(不偏推定量)はこの自由度をnではなく、n-1とします。

 

COVARIENCE.P関数とCOVARIENCE.S関数でもこの違いがあり、COVARIENCE.P関数やCOVAR関数では上述の共分散の式中にて自由度nで割っているのに対して、COVARIENCE.S関数ではn-1で置き換えたもので割っています

 

そのため、COVARIENCE.P関数の方が値としては大きくなります。

 

標本データや母集団のデータそのものの値の共分散を求めたいのか、標本データから母集団のデータの予想を行いたいのかで適宜使い分けましょう。

 

 

Excel分析ツールを用いて相関係数を求めてみよう

 

Excel関数と同様に分析ツールを用いて相関係数を求めることが出来ます。
 
Excelのデータタブ、データ分析を選択し、共分散を選びましょう。

 

(念のため上にて解説のデータを再度載せておきます)

 

 

関数では、各配列ごとに選択していましたが、分析ツールはデータ範囲をすべて選びます。

 

ここでラベルとは上のデータでいうと質量や容量の行のことであり、今回は範囲にいれていないため、先頭行をラベルとして使用のチェックを入れません。
 
 
 
すると結果は以下のようになります。

 

左下の部分が共分散であり、対角線上は各分散を表しています。

 

値が関数で算出した時と同じであることがわかります。

 

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化Ⅰ類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?

 

 

Excel関数、分析ツールを使用せずに共分散を求めてみよう

 

関数、分析ツールを使用せずに共分散を求める方法について解説します。

 

定義式に従い、地道に算出していきましょう。

 

まずは、x(下では質量)、y(下では容量)の平均値を求めましょう。

 

各々を足してサンプル数10で割ります。

 

質量の平均は(100+250+500+ ・・・ + 2000) /10 =950です。

 

容量の平均は(3+7+12+ ・・・ + 50) / 10 = 23.5です。

 

そして各々の値から各平均を引いた値を求めましょう。

 

質量-質量の平均は各々、100-950= -850、250-950= -700・・・となり、容量-容量の平均は各々、3-23.5=-20.5、7-23.5=-16.5・・・となります。

 

そして、これらの積を求め足し合わせますと73325となり、サンプル数10であり、共分散7332.5が算出されました。

 

上と一致していますね。

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化Ⅰ類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?

 

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2(カイ二乗)分布とは
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】-(ハイフン)を入力した郵便番号の-を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square:二乗平均平方根)と標準偏差の違いは?RMSの計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?片側規格と両側規格の違い CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数(STDEV.S関数)とSTDEVP関数の違い
【Excel】VAR関数(VAR.S関数)とVARP関数の違い
【Excel】指定の倍数ごとに切り上げる方法 5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
【Excel】非表示列や行の再表示を一括で行う方法
【Excel】文の先頭に同じ文字を一括で追加する方法
対数の変換における2.303とは?常用対数と自然対数の変換
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!
【Excel】アークサインsin-1・アークコサインcos-1・アークタンジェントtan-1の計算方法【Excel】
材料証明書とミルシートの違い
【Excel】折れ線グラフで途中から点線にする方法
【Excel】折れ線グラフで途中の一部を消す方法
【Excel】折れ線グラフで途中から色を変える方法【色分け】
【Excel】数値の末尾に0を表示させ有効数字をそろえる方法
【Excel】円グラフで並び替えを行う方法【大きい順・小さい順】
【Excel】RANK関数を使用して数値の抽出・順位づけを行ってみよう
【Excel】エクセルを使用して割合や構成比を求める方法
【Excel】エクセルで文字を丸囲みする方法
【Excel】エクセルで必要ないスペースを一括で削除する方法
【Excel】エクセルで上付き文字と下付き文字を同時で行う方法
【Excel】エクセルでレ点(チェックマーク)を入力・編集・削除する方法
【Excel】「どっちが安いか」を計算する方法【値段の比較】
【Excel】前年比・伸び率・増減率(増加率・減少率)を計算する方法
【Excel】工場や施設の稼働率の定義と計算方法【演習問題】
【Excel】比率の計算方法(x:yに分ける方法)
【Excel】倍率の計算方法【入試の倍率・競争倍率】
【Excel】エクセルにおいて可視セルのみをコピーする方法
【Excel】途中で切れている折れ線グラフをつなげる方法【データ要素を線で結ぶ】
【Excel】利益と粗利の違い 利益率(粗利率)を計算する方法
【Excel】エクセルでセルに色を付けると枠線が消えるときの対処方法
【Excel】アスペクト(縦横比)を簡単に計算する方法 GCD(最大公約数)関数を使用しよう
【Excel】最大公約数を計算する方法 GCD関数の使用方法
【Excel】数字を絶対値を表示する方法 絶対値の最大値・最小値を求める方法
【Excel】エクセルのファイルにパスワードをかけ保護する方法・解除する方法
【Excel】最小公倍数を計算する方法 LCM関数の使用方法
【Excel】特定の文字を入力すると行の色が変わる設定方法【自動】
【Excel】エクセルで男女比を計算する方法
【Excel】エクセルで平均年齢を計算する方法 男女別の平均年齢を求める方法【誕生日から計算】
【Excel】エクセルで数値を丸める方法 四捨五入してみよう【ROUND関数】
【Excel】エクセルで自動で四捨五入しないようにする方法
【Excel】エクセルで小数点以下を切り捨てる方法 INT関数やTRUNC関数の使用方法
【Excel】エクセルでもともとある罫線を消す方法【薄い線の消し方】
【Excel】エクセルにおいて行と列のどっちがどっちかわからなくなったときの対処方法
【Excel】エクセルでファイルをpdf化する方法
【Excel】エクセルにおいて行と列の入れ替えを行う方法 Transepose関数の使用方法
【Excel】エクセルでBMIを求める方法
【Excel】エクセルで出席率・受講率・参加率を計算する方法
【Excel】エクセルで合格率・不合格率を計算する方法
【Excel】偏差平方和とは?計算問題を解いてみよう【演習問題】
【Excel】エクセルで達成率・進捗率を計算する方法
【Excel】エクセルで提出率を計算する方法
【Excel】エクセルで満点を変換する方法【120点を100点に換算】
【Excel】前月比・前日比・前週比を計算する方法
【Excel】人口密度を計算する方法
【Excel】エクセルで表示した近似曲線の式を出し、数式から値を求める方法
【Excel】エクセルで睡眠時間を計算する方法
【Excel】エクセルで残り時間・残日数・残月数を計算する方法
【Excel】エクセルで累積の計算をする方法
【Excel】エクセルで累積比率を計算する方法
【Excel】エクセルで表示した近似曲線の式の有効数字の桁数を変更する方法
【Excel】エクセルで表示した近似曲線の式に出るEの意味
【Excel】エクセルで表示した近似曲線を延長する方法【近似曲線の前方補外・後方補外】
【Excel】エクセルでロット数の管理を行うための方法【Celling関数】
【Excel】エクセルで基準値との差を計算する方法
【Excel】エクセルのグラフに目標値などの基準線を追加する方法
【Excel】エクセルで見え消し線・取り消し線を一部だけに引く方法
【Excel】エクセルで見え消し線・取り消し線を赤色などの色に変更する方法
【Excel】エクセルで見え消し線・取り消し線を二重線にする方法
【Excel】折れ線グラフに点を追加し、大きさ・色・形を変える方法
【Excel】エクセルでの割り算で商と余りを計算する方法【INT関数とMOD関数の使用方法】
【Excel】エクセルでの2行ごと・3行ごと・5行ごとなどまとめて合計する方法
【Excel】エクセルでexpの計算を行う方法 expのグラフを作成する方法

HOME プロフィール お問い合わせ