No.15868 標準偏差SD、標本誤差SEについて  【かず】 2011/12/04(Sun) 14:55

お世話になります。

表題の件についてよくわからなくなってしまったので,教えていただきたく思います。
今,母集団の平均値や分散がわからないため,標本調査をするとします。
サンプルサイズはnです。

このとき,取得したデータそのもののばらつきを表すものとして偏差平方和をサンプルサイズnで割った標本分散,母分散を推定したものとしてn−1で割った不偏分散があり,それぞれを平方根で割ると標本標準偏差,不偏標準偏差になろうかと思います。

お尋ねしたいことは学術論文で見かけるSDはどちらの標準偏差を意味しているかということです。
もしかすると,論文投稿者はあまり気にしていないかもしれないので,どちらを意味して記載するべきかということをお聞きしたいと思っています。
個人的には取得したデータがこれくらいばらついたということを示したいわけなので,標本標準偏差を使うべきなのではと思いました。

同様に,標準誤差SEですが,「標準偏差を√nで割ったもの」と定義しているものをみかけますが,ここでいう標準偏差が標本標準偏差と不偏標準偏差のどちらを表しているのかがよくわかりませんでした。
前述の標準偏差のように「○○であるべき」というようなところが知りたいと思います。
個人的には,標準誤差のほうは,大きなサンプルサイズであれば1.96倍して母平均の信頼区間がつかめることから不偏標準偏差を使うべきなのかなと考えたりしたのですが,実際のところはどうなのでしょうか。

以上,簡単にまとめますと,SDとSEでは標準偏差の意味合い(分母)が違うのでは?と思ってしまったのですが,どなたかご教示いただければ幸いです。

No.15869 Re: 標準偏差SD,標本誤差SEについて  【青木繁伸】 2011/12/04(Sun) 15:19

偏差平方和をサンプルサイズnで割ったものを「標本分散」と呼ぶのはおかしい。単に「分散」と呼ぶのがよい。標本分散は,標本の分散であり,「分散」も「不偏分散」も標本分散である。標本標準偏差についても同様。

母分散を推定するときに,分散は不偏ではない。不偏分散は文字通り不偏である。

> 学術論文で見かけるSDはどちらの標準偏差

普通,不偏分散の平方根を取ったものでしょう。多くの統計解析ソフトは,分散を計算するという場合,不偏分散を計算します(標準偏差も不偏分散の平方根の方を計算します)。よく分からない人が分散の平方根を取ることはあるかも知れません。

> 取得したデータがこれくらいばらついたということを示したい

程度のことですから,どちらを使っても大差ない(サンプルサイズが大きくなれば両者の差は小さくなるし)。

> 標準誤差のほうは,大きなサンプルサイズであれば1.96倍して母平均の信頼区間がつかめることから不偏標準偏差を使うべきなのかなと考えたりしたのですが

サンプルサイズが小さいときも,不偏分散の平方根の方を使うべきです。

統計学において,分散を使う局面はほとんどないでしょう。

No.15872 Re: 標準偏差SD,標本誤差SEについて  【かず】 2011/12/04(Sun) 17:13

青木先生

早速の回答をありがとうございます。

エラーバーで使われるSDやSEにおいて,不偏標準偏差がベースになっているのですね。
これは,統計ソフト上の仕様が優先してということではなく,定義としてそれが正しいという理解でよいでしょうか。
(サンプルサイズが大きくなれば,どちらも変わらないということはおいておいて)

それから,言葉の使い方について確認させてください。
「分散」という統計的な指標は偏差平方和をサンプルサイズnで割ったものというそもそもの定義があり,とくに対象のデータが母集団のものなら「母分散」,標本のものなら「標本分散」ということになるのでしょうか。
そして,不偏分散は標本分散の中の特殊ケースという理解でよいでしょうか?

ディレクトリの階層構造のように考えると,分散が一番上で,その子ディレクトリに母分散と標本分散,さらに標本分散の子ディレクトリに不偏分散という感じでしょうか?
不偏分散が母分散より標本分散に近いというのは自分の捉え方が違っておりました。
また,これまで,標本分散・不偏分散は同じ階層の話と捉えておりました。

よろしくおねがいいたします。

No.15877 Re: 標準偏差SD,標本誤差SEについて  【青木繁伸】 2011/12/04(Sun) 19:28

> 統計ソフト上の仕様が優先してということではなく,定義としてそれが正しいという理解でよいでしょうか

そうです。定義として正しいから,統計ソフトもそれを計算するのです。

> 対象のデータが母集団のものなら「母分散」,標本のものなら「標本分散」ということになるのでしょうか

そう言うことです。平均値なら,母平均,標本平均となりますね。分散の場合には,母分散,標本分散ですが,標本分散には分散と不偏分散の二種類があると言うことです。

> 不偏分散は標本分散の中の特殊ケースという理解でよいでしょうか

特殊ケースではありません。分散の方が特殊です。

> ディレクトリの階層構造のように考えると,分散が一番上で,その子ディレクトリに母分散と標本分散,さらに標本分散の子ディレクトリに不偏分散という感じでしょうか?

ルートディレクトリ(「散布度」とでも)の子ディレクトリに母分散と標本分散,さらに標本分散の子ディレクトリに分散と不偏分散 でしょう

No.15878 Re: 標準偏差SD,標本誤差SEについて  【ひの】 2011/12/04(Sun) 20:01

>エラーバーで使われるSDやSEにおいて,不偏標準偏差がベースになっているのですね。

違います。不偏標準偏差ではなくて,不偏分散の平方根です。この両者は同じではありません。
過去に何度か話題になってると思います。このスレッドとか。
http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc010/001.html

No.15879 Re: 標準偏差SD,標本誤差SEについて  【かず】 2011/12/04(Sun) 20:02

青木先生

何度もありがとうございます。

> ルートディレクトリ(「散布度」とでも)の子ディレクトリに母分散と標本分散,さらに標本分散の子ディレクトリに分散と不偏分散 でしょう

書籍から自分なりに捉えていた「分散,母分散,標本分散,不偏分散」の4つの関係に対するイメージが違っていました。
ありがとうございました。

No.15882 Re: 標準偏差SD,標本誤差SEについて  【かず】 2011/12/04(Sun) 20:59

ひのさま

私のコメントとご指摘がほんの少しずれてしまったようです。

>不偏標準偏差ではなくて,不偏分散の平方根です。この両者は同じではありません。
過去に何度か話題になってると思います。

すみません,過去スレッドの内容に行き当たりませんでした。
標準偏差=分散の平方根という理解が染み付いていたため,不偏分散の不偏性も標準偏差の性質として一緒にくっついてくるようなイメージでおりましたが,違うのですね。

さきほどの「分散と標本分散」という言葉をとっても,両者の関係性がおもっていたのと違ったりして(分散のほうが親ディレクトリという認識だったのですが),注意をはらいながら勉強しないといけないとあらためて思いました。

ひのさま,青木先生,ありがとうございます。

No.15883 Re: 標準偏差SD,標本誤差SEについて  【青木繁伸】 2011/12/04(Sun) 21:03

> すみません,過去スレッドの内容に行き当たりませんでした。

ひの さんのコメントにもあった,下記リンクをクリックすれば,表示されるでしょう。

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc010/001.html

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る