t分布とF分布
December 09 [Thu], 2010, 8:45
t検定に使うt分布、F検定(分散分析で使用)に使うF分布、なにこれ?
t分布とは、「t分布(または、スチューデントのt分布)は、 連続確率分布であり、サンプル数が少ない場合に正規分布をとる母集団の平均を推定する問題に使用される。」
F分布とは、「統計学および確率論で用いられる連続確率分布」
そして後は数式。
(両者とも鉤括弧内、Wikipediaより引用)
こんなんでわかるか!と思った方がきっとこちらをご覧になっているのでしょう。
心理学に従事する人間にとってはなんと実用的でない説明でしょうか。
私たちは文系です。もっと易しく解説してほしいものです。
t分布とは、という説明を書いたことがあります。
(以下、引用:http://blackcatstyle.velvet.jp/psycho/)
****************************************************
t検定の「t」って?
t検定のtは、t分布のtです。
ではt分布とはなんぞ?それは、正規分布のサンプル少ないバージョンです。語弊がありますが。
t分布の形は、サンプル数に従い変化します。
正規分布は常に一定の形(尖度・歪度=0)ですよね。
t分布の尖度は「6/自由度-4 (df>4の場合)」なので、自由度の変化=サンプル数の変化に従って、形が変わるのです。
ちなみに分散は、「df/df-2 (df>2の場合)」なので、こちらも自由度に伴い変化します。標準正規分布の分散は1です。
サンプル数を増やしていくと…尖度は分母が大きくなるので0に近づきます。
当然ですが分散もサンプル数が∞になると1になりますね。
ということでt分布は、
母集団に正規分布を仮定している際に、小サンプルからの母集団推定の精度を上げるために
正規分布をちょこっと調整してみた分布。
です。
****************************************************
実は、F分布も同じです。サンプル数によって形が変わる分布です。
その分布から予測される値と、得られたデータから算出された値を比較して
有意とか有意じゃないとかってウダウダします。
分布ってなに?という方は、そうですね・・・
くじ引きの確率が書いてある表だと思ってください。
一等、1本、二等、3本、三等、20本、みたいな。
異なるのは、中くらいが多くて、端っこが少ないのです。
100等は、罰ゲームで、1等と同じくらいあんまり出さないのですね。
t分布は1つの自由度を持っていますが、F分布は2つの自由度を持っています。
つまり、F分布の形は2つ自由度を決定しなければ決定しません。
ちなみにt値を二乗した値がF値になります。
だからt分布(t値)とF分布(F値)は実質何も変わりません。
t分布表とF分布表の対応する個所を見れば分かります。
t値は自由度が一つしかないので、F値の片方の自由度が1の場合を見てみましょう。
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/tfxp050.html
両方とも危険率αは5%で見てみると、見事にt分布(df)の値を二乗するとF分布(1,df)の値になっています。
df t分布 F分布
1 161.4 12.706
2 18.51 4.303
3 10.13 3.182
4 7.71 2.776
5 6.61 2.571
値の使用方法ももちろん同じで、データから算出されたt値やF値が、
分布によって決められた値より大きかったら、有意です。
で、分布の形がサンプルによって変わるというけれど、これ自体はどのように決められているの?
みたいな疑問もあります。
t分布はスチューデント(ゴセット)が発見したもので、F分布はフィッシャーが作りました。
発見とか書かれているくらいなので、最初は経験的なものなのでしょう。
ちなみにt値はゴセットがフィッシャーのアドバイスを受けて修正したものだそうです。
t分布とは、「t分布(または、スチューデントのt分布)は、 連続確率分布であり、サンプル数が少ない場合に正規分布をとる母集団の平均を推定する問題に使用される。」
F分布とは、「統計学および確率論で用いられる連続確率分布」
そして後は数式。
(両者とも鉤括弧内、Wikipediaより引用)
こんなんでわかるか!と思った方がきっとこちらをご覧になっているのでしょう。
心理学に従事する人間にとってはなんと実用的でない説明でしょうか。
私たちは文系です。もっと易しく解説してほしいものです。
t分布とは、という説明を書いたことがあります。
(以下、引用:http://blackcatstyle.velvet.jp/psycho/)
****************************************************
t検定の「t」って?
t検定のtは、t分布のtです。
ではt分布とはなんぞ?それは、正規分布のサンプル少ないバージョンです。語弊がありますが。
t分布の形は、サンプル数に従い変化します。
正規分布は常に一定の形(尖度・歪度=0)ですよね。
t分布の尖度は「6/自由度-4 (df>4の場合)」なので、自由度の変化=サンプル数の変化に従って、形が変わるのです。
ちなみに分散は、「df/df-2 (df>2の場合)」なので、こちらも自由度に伴い変化します。標準正規分布の分散は1です。
サンプル数を増やしていくと…尖度は分母が大きくなるので0に近づきます。
当然ですが分散もサンプル数が∞になると1になりますね。
ということでt分布は、
母集団に正規分布を仮定している際に、小サンプルからの母集団推定の精度を上げるために
正規分布をちょこっと調整してみた分布。
です。
****************************************************
実は、F分布も同じです。サンプル数によって形が変わる分布です。
その分布から予測される値と、得られたデータから算出された値を比較して
有意とか有意じゃないとかってウダウダします。
分布ってなに?という方は、そうですね・・・
くじ引きの確率が書いてある表だと思ってください。
一等、1本、二等、3本、三等、20本、みたいな。
異なるのは、中くらいが多くて、端っこが少ないのです。
100等は、罰ゲームで、1等と同じくらいあんまり出さないのですね。
t分布は1つの自由度を持っていますが、F分布は2つの自由度を持っています。
つまり、F分布の形は2つ自由度を決定しなければ決定しません。
ちなみにt値を二乗した値がF値になります。
だからt分布(t値)とF分布(F値)は実質何も変わりません。
t分布表とF分布表の対応する個所を見れば分かります。
t値は自由度が一つしかないので、F値の片方の自由度が1の場合を見てみましょう。
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/tfxp050.html
両方とも危険率αは5%で見てみると、見事にt分布(df)の値を二乗するとF分布(1,df)の値になっています。
df t分布 F分布
1 161.4 12.706
2 18.51 4.303
3 10.13 3.182
4 7.71 2.776
5 6.61 2.571
値の使用方法ももちろん同じで、データから算出されたt値やF値が、
分布によって決められた値より大きかったら、有意です。
で、分布の形がサンプルによって変わるというけれど、これ自体はどのように決められているの?
みたいな疑問もあります。
t分布はスチューデント(ゴセット)が発見したもので、F分布はフィッシャーが作りました。
発見とか書かれているくらいなので、最初は経験的なものなのでしょう。
ちなみにt値はゴセットがフィッシャーのアドバイスを受けて修正したものだそうです。
- 心理統計メモ |
- URL |
- Comment [0] |

