正規分布

【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】

 

このページでは、統計学において最も重要な分布である正規分布について解説します。

 

・正規分布の重要性

 

・正規分布を表す関数、曲線

 

・正規分布曲線の性質

 

・標準正規分布(z分布)

 

・Excelで標準正規分布を作成してみよう

 

というテーマで解説しています。

 

 

 

正規分布の重要性

 

正規分布とは、あるデータの平均値から左右対称に下図(正規分布を表す関数、曲線で解説)のよう分布している曲線のことを示します。

 

教科書やテレビ、新聞などで一度は目にしたことがあるのではないでしょうか?

 

例えば、人の身長や体重を始めとした非常に多くのデータ(標本も母集団も)はこの正規分布に従うとされています。(標本と母集団についてはこちらで解説しています)。

 

さらに標本データでは、中心極限定理と呼ばれる統計学における重要な定理が当てはまります。この定理は、母集団が正規分布に従わない場合でも標本平均は正規分布に従うという定理であり、この定理のおかげでデータがとても扱いやすくなります。(つまり私たちが解析する標本データは正規分布に従うとして良いのです。)

 

また検定と呼ばれる、ある仮説を立てその仮説を統計値を用いて検証する方法では、統計値のベースになっているものが正規分布であることも多いです(検定の概要はこちらで解説しています)。

 

上記の理由から、正規分布は統計学において非常に重要なのです。

 

関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?

 

正規分布を表す関数、曲線


正規分布の曲線を表す関数は以下の通りです。

 

横軸に確率変数(数式のxのこと)、縦軸に確率密度(f(x)のこと)を取ると、正規分布になります。

 

このような正規分布を始めとした各種確率分布を表す式を確率密度関数と呼びます。

 

 

 

また、正規分布を略して記載する場合はN(μ、σ2)と書きます。いくつか例を示しますので、グラフと照らし合わせていきましょう。μを基準に左右対称の分布となります。

 

下図を見ますと、N(0,1):青色(標準正規分布と呼びます) 、N(1,1):赤色、N(0,0.5):緑色の曲線を表します。

 

平均値が基準値(下記に示す標準正規分布の値)からずれますと左右方向に(大きくなると右に)、標準偏差が基準値からずれますと幅と上下方向に(標準偏差が小さくなると幅が小さく、上に)グラフが変化します。

 

 


関連記事

 

標本と母集団とは?

検定の概要とは?

t分布とは?

F分布とは?

 

 

正規分布曲線の性質

 
信頼性・安全工学の分野では、品質管理の際に良く「3σでの管理」という言葉を使います。

 

これは、確率変数が正規分布に従う場合、下図のように平均値±σや±2σ、±3σの範囲内にデータの〜%が入るという性質と関係しています。正規分布でしたらどのデータにおいても下記の割合となるため、非常に便利な性質なのです。

 

平均値±σ:両側ですべてのデータの約68%がこの範囲に入ります。
平均値±2σ:両側ですべてのデータの約95%がこの範囲に入ります。
平均値±3σ:両側ですべてのデータの約99%以上がこの範囲に入ります。

 

つまり、上記に記載した品質管理における「3σでの管理」という言葉は、ある製品の値に着目しデータを解析した場合(例えば電池でしたら容量等)、平均値±3σの範囲外にある製品は何かしらの問題、不良がある可能性が高くなるため、出荷せずにはじきましょうという意味を持っているのです。

 

 
関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?

 

標準正規分布(z分布)

 
正規分布を表す関数、曲線においても記載しましたように

 

N(0,1)、つまり平均を0、標準偏差を1とした正規分布のこと(最上図:青色の曲線)を標準正規分布と呼びます。

 

各種データを比較する際に、何かしらの基準があった方がデータ同士を比較しやすいことが多いです。
正規分布におけるその基準が標準正規分布であると考えて良いでしょう。

 

各種正規分布に従う曲線を標準正規分布曲線に変換することを、標準化と呼びます(最上図で紹介した青色曲線以外が、青色曲線になるように変換することを意味します。)

 

標準化したいデータxから平均値を引き、標準偏差で割ることで標準化できます。標準化した後の値をz値(標準化変量)と呼び、この値の分布のことを標準正規分布と呼びます。

 

 

さらに、標準正規分布曲線の確率密度関数は下記の通りです。

 

 

関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?
標準正規分布表(z分布表)

 

 

Excelで標準正規分布を作成してみよう

 

Excelを使用して、標準正規分布を作成してみましょう。ここでは、NORM.S.DIST関数を使用した方法を解説します。

 

@z値の列を作成します(-4〜4まで、0.1刻みで作ってみましょう)。

 

A各z値に対応する関数を入力します。

 

下図のように =NORM.S.DIST(対応するz値、FALSE - 確率密度関数)を入力します。
(確率密度関数と累積密度関数についてはこちらで解説しています)

 

 

 

ドラッグし、すべての点数に対応する二項分布の関数を表示させて、グラフにすると完成です!

 

 
 
関連記事
 

標本と母集団とは?
検定の概要とは?
t分布とは?
F分布とは?
標準正規分布表(z分布表)

 

 


【統計処理代行】行っています


統計学や統計解析の本などは多々ありますが、実際にその統計解析が正しいのかどうかがわからないことがないでしょうか?


例えば、標準偏差を求めるときにSTDEV関数やSTDEV.S関数、STDEV.P関数など似たようなものがあったり、統計的検定を行う場合は等分散を仮定したtt検定であったり等分散を仮定しないt検定があったり等々。
そのような【統計処理を代わりに行ってほしい方々のため】に当サイト管理人であるYCが【統計解析代行】を行っています。


概要は以下の通りですので、興味ある方はお気軽にご連絡ください。


お問い合わせはこちらにお願いいたします。



【統計処理代行の概要】


・データの標準偏差、分散等の統計的基礎量の算出


・信頼区間の算出(点推定や区間推定)


・データに相関があるかどうかの判断のための相関分析


・多変量解析の代表である重回帰分析を始めとした回帰分析


・統計において非常に重要な位置付けである2群の有意差の検定(F検定やt検定等)


・二元配置分散分析を始めとした分散分析


・その他統計処理を行う前のExcel関数を使用したデータの整理


等、対応が可能です。


Excelにて統計解析を行うため、データをExcelにてご送付いただけましたら、幸いです。


また、対応可能かどうかを確認させて頂いた上でのやりとりさせて頂きたく、まずはこちらにご一報ください


【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
標本と母集団
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法

HOME プロフィール お問い合わせ