t分布とF分布

December 09 [Thu], 2010, 8:45
t検定に使うt分布、F検定(分散分析で使用)に使うF分布、なにこれ?

t分布とは、「t分布(または、スチューデントのt分布)は、 連続確率分布であり、サンプル数が少ない場合に正規分布をとる母集団の平均を推定する問題に使用される。」
F分布とは、「統計学および確率論で用いられる連続確率分布」
そして後は数式。
(両者とも鉤括弧内、Wikipediaより引用)

こんなんでわかるか!と思った方がきっとこちらをご覧になっているのでしょう。
心理学に従事する人間にとってはなんと実用的でない説明でしょうか。
私たちは文系です。もっと易しく解説してほしいものです。

t分布とは、という説明を書いたことがあります。
(以下、引用:http://blackcatstyle.velvet.jp/psycho/)
****************************************************
t検定の「t」って?

t検定のtは、t分布のtです。

ではt分布とはなんぞ?それは、正規分布のサンプル少ないバージョンです。語弊がありますが。
t分布の形は、サンプル数に従い変化します。
正規分布は常に一定の形(尖度・歪度=0)ですよね。

t分布の尖度は「6/自由度-4 (df>4の場合)」なので、自由度の変化=サンプル数の変化に従って、形が変わるのです。
ちなみに分散は、「df/df-2 (df>2の場合)」なので、こちらも自由度に伴い変化します。標準正規分布の分散は1です。

サンプル数を増やしていくと…尖度は分母が大きくなるので0に近づきます。
当然ですが分散もサンプル数が∞になると1になりますね。

ということでt分布は、

母集団に正規分布を仮定している際に、小サンプルからの母集団推定の精度を上げるために
正規分布をちょこっと調整してみた分布。

です。

****************************************************
実は、F分布も同じです。サンプル数によって形が変わる分布です。
その分布から予測される値と、得られたデータから算出された値を比較して
有意とか有意じゃないとかってウダウダします。

分布ってなに?という方は、そうですね・・・
くじ引きの確率が書いてある表だと思ってください。
一等、1本、二等、3本、三等、20本、みたいな。
異なるのは、中くらいが多くて、端っこが少ないのです。
100等は、罰ゲームで、1等と同じくらいあんまり出さないのですね。

t分布は1つの自由度を持っていますが、F分布は2つの自由度を持っています。
つまり、F分布の形は2つ自由度を決定しなければ決定しません。

ちなみにt値を二乗した値がF値になります。
だからt分布(t値)とF分布(F値)は実質何も変わりません。
t分布表とF分布表の対応する個所を見れば分かります。

t値は自由度が一つしかないので、F値の片方の自由度が1の場合を見てみましょう。
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html
http://aoki2.si.gunma-u.ac.jp/CGI-BIN/tfxp050.html
両方とも危険率αは5%で見てみると、見事にt分布(df)の値を二乗するとF分布(1,df)の値になっています。

df t分布 F分布
1  161.4 12.706
2  18.51  4.303
3  10.13  3.182
4  7.71   2.776
5  6.61   2.571

値の使用方法ももちろん同じで、データから算出されたt値やF値が、
分布によって決められた値より大きかったら、有意です。

で、分布の形がサンプルによって変わるというけれど、これ自体はどのように決められているの?
みたいな疑問もあります。
t分布はスチューデント(ゴセット)が発見したもので、F分布はフィッシャーが作りました。
発見とか書かれているくらいなので、最初は経験的なものなのでしょう。
ちなみにt値はゴセットがフィッシャーのアドバイスを受けて修正したものだそうです。

因子分析と主成分分析

September 23 [Wed], 2009, 22:53
SPSSで因子分析しようとすると、手法の中に主成分分析というものがあります。
これ、実は、因子分析ではないのです。気をつけて、ということで。

因子分析とは、
 「予め因子数を決め、その因子内の内部整合性を高めていくための手法」であり、
主成分分析とは、
 「複数の変数間の相関をなるべく少数の合成変数(つまり因子)で説明する手法」です。

(主に探索的)因子分析は、何度も繰り返し使います。項目を削ったり、足したりして内部整合性を高めます。
それに対し、主成分分析は、基本的に一回やれば充分です。

因子分析は、因子数を決めて、作業に取り掛かるという点では、「仮定」が存在するはずです。
何せ、ある特定の因子数で事を進める理論的根拠はアプリオリには決定されていません。
どの因子数を用いても、その範囲内で内部整合性を高めていくことは可能です。
一方、主成分分析は、出力された結果が全てで、「どの因子数が一番当てはまりがいいか」を出力してくれます。

自前の理論があるかないか、が最も大きな違いといえましょう。他にも相違点はありますが。
二つの違いを分かりやすく説明してくれているものに狩野(2002)があります。
http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/behavior02.html
因子分析は因子分析で、確認的因子分析、探索的因子分析と大きく二つに分かれ、用途が異なりますが、
ここではトピックの範囲を越えるので触れません。

心理学の分野では基本的に理論が先にあるはずなので、なかなか主成分分析をする機会はないと思います。
ちなみに、主因子法は、因子分析のメジャーな手法です。混同しがちですのでご注意!
P R
プロフィール
  • ニックネーム:chrone
読者になる
“心理学系大学院へ行こう”では主に大学院入試対策向けの参考書や受験に役立つ知識を紹介しています。 大学院入試以外にも、心理学系のコラムや、心理統計の基礎についての記事もあります。卒論対策にも一読ください。

このサイトはリンクフリーです。相互リンクも募集しております。
現在、WEBサイト版”心理学系大学院へ行こう”を試験運用中です。
感想をお聞かせください。


This site is powered by blackcatstyle. 
blackcatstyle 管理人の趣味サイトです。
こちらもどうぞ
にほんブログ村 科学ブログへ