正規分布

【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】

 

このページでは、統計学において最も重要な分布である正規分布について解説します。

 

・正規分布の重要性

 

・正規分布を表す関数、曲線

 

・正規分布曲線の性質

 

・標準正規分布(z分布)

 

・Excelで標準正規分布を作成してみよう

 

というテーマで解説しています。

 

 

 

正規分布の重要性

 

正規分布とは、あるデータの平均値から左右対称に下図(正規分布を表す関数、曲線で解説)のよう分布している曲線のことを示します。

 

教科書やテレビ、新聞などで一度は目にしたことがあるのではないでしょうか?

 

例えば、人の身長や体重を始めとした非常に多くのデータ(標本も母集団も)はこの正規分布に従うとされています。(標本と母集団についてはこちらで解説しています)。

 

さらに標本データでは、中心極限定理と呼ばれる統計学における重要な定理が当てはまります。この定理は、母集団が正規分布に従わない場合でも標本平均は正規分布に従うという定理であり、この定理のおかげでデータがとても扱いやすくなります。(つまり私たちが解析する標本データは正規分布に従うとして良いのです。)

 

また検定と呼ばれる、ある仮説を立てその仮説を統計値を用いて検証する方法では、統計値のベースになっているものが正規分布であることも多いです(検定の概要はこちらで解説しています)。

 

上記の理由から、正規分布は統計学において非常に重要なのです。

 

関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?

 

正規分布を表す関数、曲線


正規分布の曲線を表す関数は以下の通りです。

 

横軸に確率変数(数式のxのこと)、縦軸に確率密度(f(x)のこと)を取ると、正規分布になります。

 

このような正規分布を始めとした各種確率分布を表す式を確率密度関数と呼びます。

 

 

 

また、正規分布を略して記載する場合はN(µ、σ2)と書きます。いくつか例を示しますので、グラフと照らし合わせていきましょう。µを基準に左右対称の分布となります。

 

下図を見ますと、N(0,1):青色(標準正規分布と呼びます) 、N(1,1):赤色、N(0,0.5):緑色の曲線を表します。

 

平均値が基準値(下記に示す標準正規分布の値)からずれますと左右方向に(大きくなると右に)、標準偏差が基準値からずれますと幅と上下方向に(標準偏差が小さくなると幅が小さく、上に)グラフが変化します。

 

 


関連記事

 

標本と母集団とは?

検定の概要とは?

t分布とは?

F分布とは?

 

 

正規分布曲線の性質

 
信頼性・安全工学の分野では、品質管理の際に良く「3σでの管理」という言葉を使います。

 

これは、確率変数が正規分布に従う場合、下図のように平均値±σや±2σ、±3σの範囲内にデータの~%が入るという性質と関係しています。正規分布でしたらどのデータにおいても下記の割合となるため、非常に便利な性質なのです。

 

平均値±σ:両側ですべてのデータの約68%がこの範囲に入ります。
平均値±2σ:両側ですべてのデータの約95%がこの範囲に入ります。
平均値±3σ:両側ですべてのデータの約99%以上がこの範囲に入ります。

 

つまり、上記に記載した品質管理における「3σでの管理」という言葉は、ある製品の値に着目しデータを解析した場合(例えば電池でしたら容量等)、平均値±3σの範囲外にある製品は何かしらの問題、不良がある可能性が高くなるため、出荷せずにはじきましょうという意味を持っているのです。

 

 
関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?

 

標準正規分布(z分布)

 
正規分布を表す関数、曲線においても記載しましたように

 

N(0,1)、つまり平均を0、標準偏差を1とした正規分布のこと(最上図:青色の曲線)を標準正規分布と呼びます。

 

各種データを比較する際に、何かしらの基準があった方がデータ同士を比較しやすいことが多いです。
正規分布におけるその基準が標準正規分布であると考えて良いでしょう。

 

各種正規分布に従う曲線を標準正規分布曲線に変換することを、標準化と呼びます(最上図で紹介した青色曲線以外が、青色曲線になるように変換することを意味します。)

 

標準化したいデータxから平均値を引き、標準偏差で割ることで標準化できます。標準化した後の値をz値(標準化変量)と呼び、この値の分布のことを標準正規分布と呼びます。

 

 

さらに、標準正規分布曲線の確率密度関数は下記の通りです。

 

 

関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?
標準正規分布表(z分布表)

 

 

Excelで標準正規分布を作成してみよう

 

Excelを使用して、標準正規分布を作成してみましょう。ここでは、NORM.S.DIST関数を使用した方法を解説します。

 

①z値の列を作成します(-4~4まで、0.1刻みで作ってみましょう)。

 

②各z値に対応する関数を入力します。

 

下図のように =NORM.S.DIST(対応するz値、FALSE - 確率密度関数)を入力します。
(確率密度関数と累積密度関数についてはこちらで解説しています)

 

 

 

ドラッグし、すべての点数に対応する二項分布の関数を表示させて、グラフにすると完成です!

 

 
 
関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?
標準正規分布表(z分布表)

 

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2(カイ二乗)分布とは
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】-(ハイフン)を入力した郵便番号の-を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!~以上かつ以下、~以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square:二乗平均平方根)と標準偏差の違いは?RMSの計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?片側規格と両側規格の違い CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数(STDEV.S関数)とSTDEVP関数の違い
【Excel】VAR関数(VAR.S関数)とVARP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
【Excel】非表示列や行の再表示を一括で行う方法
【Excel】文の先頭に同じ文字列を一括で追加する方法【一括で追加】
対数の変換における2.303とは?常用対数と自然対数の変換
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!
【Excel】アークサインsin-1・アークコサインcos-1・アークタンジェントtan-1の計算方法【Excel】
材料証明書とミルシートの違い
【Excel】折れ線グラフで途中から点線にする方法
【Excel】折れ線グラフで途中の一部を消す方法
【Excel】折れ線グラフで途中から色を変える方法【色分け】
【Excel】数値の末尾に0を表示させ有効数字をそろえる方法
【Excel】円グラフで並び替えを行う方法【大きい順・小さい順】
【Excel】RANK関数を使用して数値の抽出・順位づけを行ってみよう
【Excel】エクセルを使用して割合や構成比を求める方法
【Excel】エクセルで文字を丸囲みする方法
【Excel】エクセルで必要ないスペースを一括で削除する方法
【Excel】エクセルで上付き文字と下付き文字を同時で行う方法
【Excel】エクセルでレ点(チェックマーク)を入力・編集・削除する方法
【Excel】「どっちが安いか」を計算する方法【値段の比較】
【Excel】前年比・伸び率・増減率(増加率・減少率)を計算する方法
【Excel】工場や施設の稼働率の定義と計算方法【演習問題】
【Excel】比率の計算方法(x:yに分ける方法)
【Excel】倍率の計算方法【入試の倍率・競争倍率】
【Excel】エクセルにおいて可視セルのみをコピーする方法
【Excel】途中で切れている折れ線グラフをつなげる方法【データ要素を線で結ぶ】
【Excel】利益と粗利の違い 利益率(粗利率)を計算する方法
【Excel】エクセルでセルに色を付けると枠線が消えるときの対処方法

HOME プロフィール お問い合わせ