【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう

【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう

 

このページではばらつきを表す代表的な統計的パラメータである分散と標準偏差を始めとして統計的な基本統計量について解説します。

 

・分散の定義式は?

 

・標準偏差の定義式は?

 

・Excel関数(VARP関数(VAR.P関数)、STDEVP関数)を使用して分散、標準偏差を算出してみよう

 

・Excel分析ツール(基本統計量)を使用して分散と標準偏差を求めてみよう!

 

・補足:基本統計量の分散、標準偏差以外の用語の解説 対応するExcel関数は?

 

というテーマで解説しています。

 

 

分散の定義式は?

 

分散の定義式は以下の通りです。

 

 

 

( )内が平均値からのずれを示し、2乗しないまま各( )内をすべて足し合わせると0となるため、2乗した値を使用します。( )内を2乗した和をデータ数で割ったものが分散です。

 

標準偏差の定義式は?

標準偏差の定義式は以下の通りです。
 
 

 

分散にルートをつけたものを標準偏差と呼びます。

 

標準偏差は一般的なバラつきを示す尺度として使用されます。

 

分散と比べて、標準偏差は( )内を2乗した分を戻すことになるため単位も2乗から戻るため収まりが良く、また値が小さくなるため扱いやすいです。

 

標本データそのものにおける標準偏差は一般的にsで表されます。

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
変動係数(CV)とは?算出方法は?

 

 

Excel関数(VARP関数(VAR.P関数)、STDEVP関数)を使用して分散、標準偏差を算出してみよう

 

下記のデータについて、Excel関数を使用して分散、標準偏差を算出してみましょう。

 

 

 

※上記は架空のデータです。

 

Excelデータ分析でなく、関数を使用します。分散ではVARP、VAR.P関数、標準偏差ではSTDEVP関数を使用します。

 

この関数は上式で解説した各一般式と一致する関数であり、標本データそのもののや入手データの数が多く母集団のデータとして扱ってよい場合は、これらの関数を使用します。

 

他に似ている関数、VAR関数やSTDEV関数がありますが今回は使用しません。

 

一般的に標本データから母集団のデータを推測する際には、VAR関数やSTDEV関数を用いますが、今回は標本データそのもの(もしくは母集団とみなせる場合は母集団のデータ)の標準偏差を求めるため、分散ではVARP関数やVAR.P関数、標準偏差ではSTDEVP関数を使用します。

 

 

=VARP(分散を求めたい範囲)で分散を算出、=STDEVP(分散を求めたい範囲)で標準偏差を算出することができます

 

(VAR関数やSTDEV関数は不偏統計量を扱う関数であるため、上式分母のnをn-1に置き換えた値であり、若干大きく補正されます。)

 

(標本と母集団、不偏統計量についてはこちらで解説しています)。

 

範囲を指定しましたら、下記のように結果が得られます。

 

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
変動係数(CV)とは?算出方法は?

 

 

Excel分析ツール(基本統計量)を使用して分散と標準偏差を求めてみよう!

 

分散や標準偏差といった統計量を始めとした基本的な統計量を一度に算出することが、Excel分析ツールでは出来ます。

 

Excel分析ツールにおける基本統計量とは、平均(算術平均)、標準誤差、中央値(メジアン)、最頻値(モード)、標準偏差、分散、尖度、歪度、範囲、最小、最大、合計、標本数、信頼区間、N番目に大きい値、N番目に小さい値であり(後程各々のパラメータについて解説しています。)、非常に多くの値を算出してくれます。

 

これらを求める手順は以下の通りです。以下のデータ例(架空のデータ)を用いて基本統計量を算出していきましょう。

 

 

 

分析ツールを起動させ、データ分析の基本統計量を選択します。

 

 

そして、入力範囲は統計量を知りたい範囲を全て選択します。

 

ここで、選択範囲にラベル部分(今回の場合はアイスの値段)を含む場合は、先頭行をラベルとして使用にチェックをいれ、範囲に入れていない場合はチェックを外しましょう。

 

さらに、出力オプションの部分に統計情報、平均の信頼区間の出力、K番目に大きな値(とKの値)、K番目に小さな値(とKの値)を入れ、結果を出力させます。

 

統計情報にチェックを入れておけば平均(算術平均)、標準誤差、中央値(メジアン)、最頻値(モード)、標準偏差、分散、尖度、歪度、範囲、最小、最大、合計、標本数が出力されます。
 
他の信頼区間を求めたい場合やK番目に大きな値、小さな値が求めたい場合は各々の項目にもチェックを入れましょう(今回はチェックを入れています)

 

 

 

すると以下のような値となります。

 

 

 

すると標準偏差は80.94、分散は6551.1となります。

 

 

ここでの標準偏差や分散は標本データから母集団のデータを予測する不偏推定量を表しています。

 

そのため基本統計量における分散はExcel関数ではVAR関数、VAR.S関数に対応しています。

 

また、同様に基本統計量における標準偏差はExcel関数ではSTDEV関数に対応しています。

 

上で紹介しましたVAR.P関数やSTDEVP関数とは値が異なりますので、気をつけましょう(上で紹介した値では、標準偏差は76.79、分散は5896と異なっています)。

 

分散、標準偏差以外のパラメータについても解説します。

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
変動係数(CV)とは?算出方法は?

 

補足:基本統計量の分散、標準偏差以外の用語の解説 対応するExcel関数は?

 

平均(算術平均)

 

平均(算術平均)は、一般的に使用される平均のことを指します。

 

Excel関数ではaverage関数を使用します。

 

詳細はこちらで解説していますので、参考にしてみてください。

 

 

標準誤差

 

標準誤差とは、標準偏差をサンプル数のルートで割ったものの値のことを指します。

 

標準誤差も標本データそのものや母集団そのもの、標本データから母集団の予測する場合で若干数式がことなります

 

直で標準誤差を算出できるExcel関数はなく、標準偏差を算出した後にサンプル数を算出し、数式に当てはめることで計算できます。

 

標準偏差は上述のように、STDEV関数やSTDEVP関数を使い分けて、算出します

 

サンプル数はCOUNT関数を使用すればすぐに算出することができます。

 

 

中央値(メディアン、メジアン)

 

中央値とは、あるデータを値が大きい順、または小さい順に並び替えた場合、中央にくる値のことを指します。

 

また、データ数が偶数の場合は中央にくる値が二つとなるため、その二つの平均の値を指します。

 

Excel関数では、MEDIAN関数により算出できます。

 

詳細はこちらで解説していますので、参考にしてみてください

 

 

最頻度(モード)

 

最頻度とは、あるデータの中で最も多く出てくる値のことを指します。同じ値がいくつあるかを調べて、その数が多いもののことを指します。

 

Excel関数では、MODE関数やMODE.SNHGL関数により、最頻度を算出することができます。

 

詳細はこちらで解説していますので、参考にしてみてください

 

 

分散、標準偏差

 

分散、標準偏差は上述の通りです。

 

 

尖度(せんど)、歪度(わいど)

 

尖度、歪度とは正規分布と比較した際にデータの分布が正規分布より、より尖っているか(抽象的なイメージ)歪度とは左右が非対称性かどうかを表した値と言えます。

 

正規分布について知らないと良く理解できないパラメータかと思いますので、正規分布について参考にしてみてください。

 

なお、尖度、歪度の詳細はこちらで解説しており、Excel関数はSKEW関数、KURT関数を用います。

 

 

範囲、最小、最大、標本数

 

範囲、最小、最大、標本数は言葉の通りであり、データ中の最小値のことを最小、最大値のことを最大、最大値−最小値のことを範囲、標本数はデータの数のことを指します。

 

最小はMIN関数、最大はMAX関数、標本数はCOUNT関数により求める事ができます。

 

範囲は最大−最小を行うことで算出していきましょう。

 

 

K番目に大きい、小さい値

 

K番目に大きい、小さい値は言葉の通りであり、言葉の通りであり、データ中のK番目に大きい、小さい値を出力します。

 

Excel関数では対応するものがないため、分析ツールを活用しましょう。

 

 

信頼区間の推定

 

信頼区間の推定における母平均から各限界値までの大きさを出力します。

 

CONFIDENCE.T関数を使用することで信頼区間の推定を行うことが出来ます。

 

ここで、=CONFIDENCE.T関数では(有意水準、不偏標準偏差(分母n-1でExcel関数ではSTDEV関数により求められる値、データ数)により、推定を行えます。

 

ここで出力される値は、下限値≦母平均≦上限値における母平均から各限界値までの大きさ(片側)に対応していることに気を付けましょう。

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
変動係数(CV)とは?算出方法は?

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square)を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!

HOME プロフィール お問い合わせ