標本と母集団

標本と母集団

 

このページでは標本と母集団について解説します。

 

標本と母集団

母集団は統計的に分析することで推測しようとしている対象物すべてのことを指します。
(下図では海の中等々にいるある特定の魚すべて)

 

私たちが手に入れる実験データやアンケートは標本と呼ばれるものに当たります。標本は母集団から一部のデータをランダムで取り出したものです(意図的に取り出すとデータが偏り本来の母集団の予測ができなくなてしまいます)。(下図では採取して水槽の中に入れた魚)

 

 

 

 

標本データから母集団の推測を行う(不偏推定量)

上記のような海の中にいる魚を全数検査することは難しいため、実際は標本データから母集団の推定を行います。

 

標本から推測する母集団のことを不偏推定量と呼びます。

 

標本、母集団、不偏推定量を区別するため、以下のように表示記号を区別します。

 


上記のよう標本平均では得たデータそのままの平均、分散、標準偏差を取ったものの値を使用します。

 

 


上記のよう、母集団の平均はμ(ミュー)で表します。世の中に存在するすべてのサンプルの平均を取ることになるので、一般的にはこの値は未知です。また、母分散や母標準偏差もほとんどのケースで未知です。

 

そのため、次の不偏推定量として標本から母集団を推定することが重要になるのです。

 

 
不偏分散、不偏標準偏差では母集団の平均ミューをxバーに置き換えます(標本データから算出出来る値を採用します)。
さらには標本や母集団で分母nを取っていたところをn-1に置き換えるだけで推定が出来るのです。
とても不思議ですね。

 

この理由は後程導出過程を解説します。

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
工程能力指数CP,CPK,PPKとは?計算方法は?

 

 

標本と標本平均の分布

上記では、標本の分布を扱い、その平均や分散、標準偏差について主にを解説してきました。

 

次に標本平均の分布というものについて考えていきます。何回かに分けてあるデータを採取した場合など、各々の標本データの平均自体も分布することがわかるでしょう。

 

ここで、標本の分布と標本平均の分布には下図のような重要な関係があります(別ページで解説しています正規分布を用いて解説します)。

 

標本平均の標準偏差は母集団の分散が既知(もしくは標本サイズが大規模(n=50程度以上)の場合、母標準偏差の1/ルートn倍した値(分散だと1/nした値)に幅が変化した分布を取ります。

 

さらに、これは不偏統計量にも適用され、各々下式のような関係になっています。

 

後に出てくる統計において重要な信頼区間の推定や検定では、この標本平均の分布がベースになっています。そのため、この考え方は非常に重要であり、きちんと理解しましょう。

 

 

 

 

この標本平均の標準偏差のことを標準誤差と呼び、標本平均の分散のことを誤差分散と呼びます。
これらは分母にデータ数nの項が含まれているため、データが多ければ多いほどバラつきが少なくなります。

 

この辺りの言葉はややこしいため、整理して理解していきましょう。

 

 

 

 

 

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
工程能力指数CP,CPK,PPKとは?計算方法は?

 

不偏推定量算出する時、なぜn-1で割るのでしょうか?

不偏推定量算出時にn-1で割る理由は一言でいうと、標本平均自身のバラつきも考慮するからです。

 

下記のよう、母平均を標本平均で置き換えた場合、標本平均のバラつきも考慮する必要が出てくるため、この補正として誤差分散を加算します。
 
 

 

そして、式変形、記号を不偏統計量のものに変更するとn-1で割る理由が導出されました。
 
なお、このn-1のことを自由度と呼びます。

 

関連記事

 

Forecast関数とは?使用方法は?単回帰分析の方法
Forecast関数による単回帰分析の使用例(電池における直流抵抗(DCR)の算出)
二元配置の分散分析とは?
多重比較法とは?
定量的なデータの重回帰分析をExcel分析ツールを用いて行う方法
質的データの重回帰分析をExcel分析ツールを用いて行う方法 数量化T類とは?
ピアソンのχ2検定とは?
相関とは?相関係数を求める方法は?CORREL関数、PEARSON関数
標本から母集団の関係 不偏推定量とは?
工程能力指数CP,CPK,PPKとは?計算方法は?

 

 

 

また、当サイトのメインテーマであるリチウムイオン電池、電気化学関連の用語は以下でまとめています。

 

興味がある方は参考にしてみてください。

 

標本と母集団 関連ページ

Excelデータ分析ツール使用の前準備
度数分布表とヒストグラム
【Excel】平均とは?(算術平均と加重平均) AVERAGEIF関数で条件付き(〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定)の平均値を算出してみよう
【Excel】平均とは?2 (幾何平均、移動平均)
【Excel】分散と標準偏差とは?基本統計量とは?Excel関数(VARP関数、STDEVP関数)で分散と標準偏差を計算してみよう
【Excel】変動係数(CV)とは?エクセルで計算してみよう!【演習問題】
信頼区間の推定
信頼区間の推定をExcelを用いて行ってみよう!
【演習問題】信頼区間の推定を実際に行ってみよう CONFIDENSE.T関数とCONFIDENCE関数の違いは?【Excel】
二項分布
【Excel】正規分布とは?NORM.S.DIST関数で正規分布を描いてみよう【演習問題】
【Excel】ポアソン分布とは?POISSON関数、POISSON.DIST関数の使用方法【演習問題】
正規分布の応用技術(自動運転車におけるAI)
推測統計学とt分布
χ2分布
【Excel】正規分布における歪度と尖度をSKEW関数、KURT関数で計算してみよう【演習問題】
【Excel】RAND関数、RANDBETWEEN関数を用いて乱数を作ってみよう 正規分布に従う乱数発生方法は?【演習問題】
F分布
統計的検定の概要
2群の差の検定(t検定)と検定フロー
F検定(等分散かどうかの検定)
F検定(等分散かどうかの検定)を分析ツールを使用せずに行う方法
Excel関数(FINV、F.INV.RT関数)でF検定時の上側確率に対応するF値を算出する方法
Excel関数(TINV、T.INV.2RT関数)でt検定時の両側確率に対応するt値を算出する方法
等分散の時のt検定
等分散でない時のt検定(ウェルチの検定)
パラメトリック手法とノンパラメトリック手法の違い ノンパラの紹介
ピアソンのχ2検定(ノンパラメトリック手法) 適合度の検定、独立性の検定
マン・ホイットニーのU検定
【Excel】マクネマー検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】Wilcoxonの符号付順位和検定とは?Excelを使用して演習問題を解いてみよう!
【Excel】相関、相関係数とは?COOREL関数、PEASON関数、分析ツールで算出しよう【演習問題】
【Excel】共分散とは?COVAR関数,COVARIANCE.P関数を使用して共分散を求めてみよう COVARIANCE.P関数と.S関数の違いは?【演習問題】
【Excel】階乗の計算方法 FACT関数で階乗を求めてみよう【演習問題】
参考文献
【Excel】関数を使わずにデータを間引く方法
【Excel】関数を使用してデータを間引く方法(INDIRECT関数)
【Excel】関数を使わずにn行ずつ空欄を追加する方法
【Excel】数字の間にハイフンを一括して入れる方法
【Excel】−(ハイフン)を入力した郵便番号の−を消す、再度つける方法
【Excel】Forecast関数で直線補間してみよう!Trend関数との違い
【Excel】SUMPRODUCT関数で積の合計を計算しよう!SUM関数との違い
【Excel】SUMIFS関数で複数条件の和の計算を行ってみよう!〜以上かつ以下、〜以上かつ未満、不等号、日付の範囲指定【演習問題】
【Excel】°(度)とrad(ラジアン)の変換方法【計算の考え方】
【Excel】勾配の計算方法 Excelを用いて勾配を計算してみよう
【Excel】sin曲線(サインカーブ)・cos曲線(コサインカーブ)を書く方法
【Excel】RMS(Root Mean Square)を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】工程能力指数のCP,CPK,PPKとは?CPKから不良率を算出する方法は?計算問題を解いてみよう【演習問題】
【Excel】Vlookup関数の使用方法
【Excel】STDEV関数とSTDEVP関数の違い
【Excel】5ずつ切り上げる方法 1-5を5、6-10を10とする方法
【Excel】2つのif関数でデータを3種類に分類する方法 (A以上B以下)
【Excel】条件に合うデータの数量の数え上げ Countif,Countifs関数
【Excel】Excelソルバーで最適化問題を解こう!生産計画,線形計画問題【演習問題】
【Excel】Excelソルバーで最適化問題を解こう!二次関数の問題【演習問題】
両側検定と片側検定の違い
分散分析 対応の無い場合の一元配置の分散分析をExcelで行ってみよう
分散分析 対応の有る場合の一元配置の分散分析をExcelで行ってみよう
分散分析 繰り返しの無い、有る場合の二元配置の分散分析をExcelで行ってみよう
多重比較法とは?分散分析との違い Tukeyの方法
数量化I類とは?Excelを用いて定性的なデータ(質的データ)の重回帰分析を行ってみよう
重回帰分析とは?Excel分析ツールで定量データの重回帰分析を行ってみよう!【リチウムイオン電池のデータ解析】
【Excel】最小二乗法とは?INTERCEPT関数とSLOPE関数の使用方法【単回帰分析、重回帰分析】
【Excelまとめ】Excel関数、分析ツールで統計解析を行おう
品質工学におけるFTA(故障の木解析)とは何か?FTAの原理とやり方
品質工学におけるFMEA(故障モード影響解析)とは何か?FMEAの原理とやり方
多変量解析 主成分分析と因子分析とは?違いは?
実験計画法
【Excel】Excelで対数関数の計算・グラフを書いてみよう!

HOME プロフィール お問い合わせ