超簡単・心理統計の基礎E 分散分析おまけ

April 19 [Sun], 2009, 17:37
分散分析って平均値の比較なのに、なぜ分散分析というのでしょうか?

それは!

分散が重要だから。は、間違ってないけれど、説明不足。

群間の平均値差を、誤差の分散で説明できるか否かを判断の基準にするからです。

群間の差とは、比べたい群同士の差です。
たとえば、1要因3水準あれば、群はとりあえず3つありますね。
紅組、白組、黒組の成績の差を比べたい、みたいな。
それぞれの群にサンプルが複数いますんで、平均値も出ますし、分散も出ます。
分散とは、データのばらつき具合を言うのでした。

3群の平均値が違う。
しかし、これが偶然ばらついたのか、そうじゃないのかを判断したいわけです。
偶然のばらつきって、誤差ですよね。
その誤差のばらつき具合に、群間の平均値のばらつき(つまり群間の差)が
含まれてしまうのか、それともそんなんじゃ説明できないくらいに、群間の差が大きいのか。

これを見ているわけですよ。分散分析。

超簡単・心理統計の基礎D 分散分析

February 18 [Wed], 2009, 17:52
D三群以上の平均値の比較(分散分析)

三群以上の平均値の差の比較の検定には分散分析を用います。
たとえば、指導法A,B,Cの違いを、A群とB群とC群の英語の成績を用いて検定するような場合です。
または、指導法A,Bの違いを、A群とB群の英語と国語の成績を用いて検定したいような場合です。
ちなみにここでは、「組」という要因の影響は抜いて考えています。
前者を1要因3水準、後者を2要因2水準の分散分析といいます。なんじゃこりゃ。

用語の説明に入る前に、ひとつ重要なことを述べておきます。
分散分析は、要因の効果があるか、ないかを検定する統計法です。とりあえず覚えていてください。

・要因と水準
要因とは、従属変数に与える影響(独立変数)の種類のことです。
前者の例の場合、独立変数は「指導法」のみだから1で、後者の例の場合は、
独立変数は「指導法」と「教科」だから2になります。
水準とは、一つの要因(独立変数)における種類の数です。
前者は、三種類の指導法があったので、3です。後者では、指導法はA,B2つ、教科は英語と国語の2つ。

分散分析においても対応の有無が問題になり、被験者内要因か被験者間要因であるかを考慮します。
同じ被験者が異なる水準のデータにも登場するならば被験者内要因です。
前者の例を見てみると、指導法の水準3つを3つの群に割り振っています。
ということは、3つの水準のデータは、異なる被験者から出ていることになるので、これは被験者間です。
後者の例では、指導法はA群とB群で異なる被験者なので、被験者間要因。
一方、教科はA群内、B群内で共通の被験者が出すものなので、被験者内要因です。
ひとつの実験計画に被験者内要因と被験者間要因が含まれている時には混合計画と言います。

だから前者は被験者間要因で1×3の分散分析、後者は混合計画で2×2分散分析とか言います。

・主効果と交互作用
分散分析にはt検定にない新たな問題が出てきます。それが、主効果と交互作用という問題です。
主効果とは要因単独の効果で、交互作用とは要因が二つ以上絡み合った効果を指します。

とりあえず先程の、2×2の分散分析の例で考えてみましょう。
指導法の主効果、というのは指導法Aを導入したA群の成績の方がB群よりも
英語と国語の両方において高く(低く)なることで示されます。

一方、教科の主効果とは、A群においてもB群においても、英語の方が国語の点数よりも
高い(低い)ようなことを言います。
有意な教科の主効果が見られた時に言えることは、どちらかのテストが簡単だった、ということです。

さて、次に交互作用ですが、英語の成績に関しては、A群はB群よりも高かったのだけれど、
国語の方では変わらなかった、いや、逆にB組より低かった。なんて場合に登場します。
こんな時には、交互作用が有意になります。
そして、指導法Aは英語にのみ効果が見られた、という結論が出てきます。

さて、主効果も交互作用も有意になったときは、どう考えればいいでしょうか?
そんな時は、主効果が有意だったとしても主効果についての検討は避けろ、とよく言われます。
つまり、片方の水準の効果がもう一方のダメだった方の水準の効果をカバーして
全体としての主効果を有意にした可能性があるために、
ほんとに主効果があったのかどうかがわからないのです。
交互作用を抜きにして要因の効果に検討したいときは、単純主効果の分析というものを行います。
単純主効果とは、特定の水準における、主効果の分析です(=1要因の分散分析です)。

・多重比較
交互作用が出た時、多重比較というものを行います。
また、交互作用が出なくても、仮説検証に必要であれば、多重比較を行います。
多重比較とは、全体の効果ではなく、どことどこの間に差があるかを細かく見るものです。
なので、上に挙げたような単純主効果の分析というやつも、多重比較で行えます。
一般に多重比較という言葉は、3水準以上ある要因について、どの水準とどの水準の間に
効果があるのかを調べる時に使うようです。以下に具体例を見てみましょう。

最初の方の1要因3水準の例を見てみます。
要因の主効果が有意になったということは、A,B,C群に差がないとは統計的に言えない、
ということを意味します。とっても回りくどいのです。
では、具体的に、どことどこに差があったのか。これを多重比較で調べます。
多重比較とは、ある方法を用いて、t検定を繰り返す統計法です。
t検定を単純に繰り返すことができないことについては、他で解説します。
このケースではAとB、AとC、BとC、と3回比較をします。これが比較いっぱい多重比較。

二番目の2要因2水準の例が2つの要因の主効果、交互作用ともに有意になったとしましょう。
交互作用が有意になったので、考察において「指導法に効果があった」とそのまま結論することは
できません。交互作用とは、主効果ちょっと待った作用、という感じです。ここで多重比較を行います。
普通は、A1とA2の比較、およびB1とB2の比較をします。
ただし、理論的にはA1とA2、A1とB1、A2とB2、B1とB2という全ての対の比較が可能です。
(A1=指導法A・教科1…と考えてください)
今回挙げた例(2水準の場合)では、多重比較=単純主効果の分析となります。

主効果や交互作用が有意でなくとも、分析の方法によっては多重比較でどこかが有意になることはあり得ます。
結局、統計においては、「何をすればいいのか」ではなく、仮説検証において、
「何の効果が見たいか」ということが大事なのです。

超簡単・心理統計の基礎C t検定

February 18 [Wed], 2009, 17:47
C二群の平均値の比較(t検定)

二群の平均値の比較にはt検定を用います。
t検定は、統計量がt分布に従うことを利用した統計法です。
なので、t分布って何?ということを知らなければt検定もわからないのですが、
知っていても知らなくても別に困らないので、まず、t検定の使い方のみを説明します。

t検定の考え方は、統計的仮説検定の項で説明したとおりです。
対象のデータにおいて、二つの群の平均値に差が無いと仮定すると(帰無仮説)、
なんかおかしいんじゃない?という結果がでたら、帰無仮説を棄却し、
こりゃ差が無いとはいいづらいねー、となります。

たとえば、指導法の違いによってA組とB組の英語の平均点を較べる時などに用います。
さて、t検定を使うときに、いくつか設定しなければならないことがあります。
つまり、有意差を決定するときに、考慮しなければならないことです。
実際に何がどうなるのかは、統計ソフトに任せて、用語だけ知っておきましょう。

・対応の有無
対応と、言うのは、二つの群におけるサンプルの対応ということです。
つまりは、二つのデータが関係しているかしていないか、です。

A組とB組の点数を比較するときは、関係ない人たちなので、対応はありません。
では、A組とB組が全員双子の片割れずつを集めたクラスだとしたら、どうでしょうか。
そうすると、A組にもB組にもかなり関係がある人たちがそれぞれ集められているので、対応があります。
もう少し現実的な対応があるケースは、A組内での英語と国語の点数を比較する場合です。
この場合は、同じ人たちがデータの出所なので、対応があることになります。

対応の有無は、検定力というものに関係があります。検定力とは、有意な差を見出す力です。
対応のある群を比較した方が、余計な誤差が入りにくいので、検定力が高くなります。
余計な誤差というのは、個人差というものです。
同じ人の成績を比較する時には個人差の要因は省かれるので、その分、信頼できる推定ができます。
そうすると、もう少し基準甘めでもいいんじゃない?ということになり、有意差が出やすくなるわけです。

・片側と両側
差の検定をするときには、少なくとも心理学では、何か仮説があったはずです。
つまり、「新しい指導法は古い指導法よりも効果的である」みたいな。
そして新しい指導法をA組に、古い指導法をB組に、という実験計画を立てるわけです。

しかし実際、t検定で検討するのは、差があるかどうか、です。
差があるといった場合は、用意した仮説とは逆に、
「古い指導法は新しい指導法よりも効果的である」場合も、差がある、となってしまうのです。
それは困る。ので、

差があることに加えて、「差の方向」をも決定しているときには、「片側検定」を用います。
そして、漠然と「差がある」といった場合には「両側検定」を用います。
片側よりも両側の方が確率が半分であるため、有意差がその分出にくくなるわけです。
結構これはクリティカルな問題なので、検定の際は間違えないようにしましょう。
心理学実験においては大体において、しっかりとした仮説があるため、片側検定を使用します。
というか、両側検定を用いるような仮説を立ててはいかんぜよ。


D分散分析

超簡単・心理統計の基礎B 統計的仮説検定

February 18 [Wed], 2009, 17:42
B統計的仮説検定

心理学実験の目的は、何かの要因(独立変数)によって、何か(従属変数)が影響を受けたこと、
つまり、独立変数を操作することによって従属変数に「差が生まれたこと」を示すことです。
そしてこの差が、「偶然ではない差」であることを保証するための方法が、統計的仮説検定です。

このとき、自分が主張したいことを対立仮説、その逆を帰無仮説と呼びます。
たとえば、対立仮説が「新しい教授法には効果がある=新しい教授法と古い教授法には差がある」としたら、
帰無仮説は、「新しい教授法には効果がない=新しい教授法と古い教授法には差がない」。
帰無仮説は文字通り、無に帰してほしい仮説のことを言います。
つまり帰無仮説を棄却すること、こんな仮説はありえん!と言うことで、
じゃあ仕方ないから、逆の仮説を選んでおこうか?とする作業のことを、
「統計的仮説検定」と言います。

もう少し噛み砕いてみましょう。
帰無仮説というのは、「もし差が無かったとしたら」と考えてみることです。
今回のデータにおいて、差が無い確率はどんなものかね、と計算してみる。
ん、とても低い!となったら、そんな低い確率でしか起こり得ないことが起きちゃったのか…
じゃあ、今回の(帰無)仮説間違ってるんじゃねぇ?という流れが統計的仮説検定です。

…なんでそんな面倒なことを?
何故「差がある確率」を積極的に計算しないのか??

たぶん、それは、「0である確率」と「1とか0.2とか-5とか…な確率」というものの差だと思います。
「0である確率」は、ターゲットが一つなので、計算しやすい。
対して、差がある確率は、差は無限大に存在するため、ターゲットが決まりません。
なので、計算できません。
こういう時どうするかと言うと、全部の確率(100%)から「0である確率」を引きますよね。
つまり、「差が0であるとは言えない確率」。これが≒「差がある確率」。
差が0であるとは言えない…というのが、つまり、帰無仮説の棄却なわけです。
たぶん。これは、僕がそう理解しているだけであって、保証はないです。

さて、確率と言うからには、0%とか100%ってのはあまり無いわけです。
なので、差が0である確率が低いと、差が無いっていう仮説は間違いじゃないかな、となるわけですが、
この基準はなんと5%以下なのです。なんでまた5%なのでしょうか?
実は、この基準に明確な理由はありません。
20個に1個を、1回で引き当てるのって中々無理だよね、ってことです。
この値を有意水準と言いますが、間違いを冒す割合でもあるので、危険率とも呼びます。

有意水準を下回っていると、差がないとは言えないので、おそらく差があるわけですね。
このことを、「有意に差がある」「有意差がみられる」と言います。
ちなみに、一般には差がない確率が低いことは、それだけ自信を持って差があると
言えることなので、確率が低いことは大々的に主張したくなります。
一番ギリギリが5%ですが、それより小さい時には5%水準で有意差が見られた、とか言います。
1%より小さければ1%水準の有意差、0.1%より小さければ0.1%水準の有意差です。

改めて釘を刺しておきますが、この有意水準は、差が無いことはないよと発言するための
自信の程度に関するものであって、差の大きさを示すものではありません。
つまり5%水準だろうと0.1%水準だろうと、差はあくまで平均値の差でしかありません。
0.1%水準だったからって、要因の効果が大きかった、なんて言ってはいけないのです。
要因の効果は、あくまで、平均値の差。(効果量という統計値もありますが)
ただし、一般に要因の効果が大きいと、有意差も出やすくなります。当たり前ですが。
5%だろうと、0.1%だろうと、考察の段階では同じ扱いをしましょう。有意は、有意。

Ct検定

超簡単・心理統計の基礎A 記述統計量

February 18 [Wed], 2009, 17:35
A記述統計量

平均値 (Mean or Average)    = (データを全部足したもの)÷サンプル数
分散 (Variance)           = {(データ−平均値)^2を全部出したもの}÷サンプル数
標準偏差 (Standard deviation) = 分散の平方根 (√分散)

他にもたくさんありますが、これらが代表的な記述統計量です。
統計には記述〜と、推測〜があります。記述統計量というのは、
データ全体の性質を表すものであり、推測を含まない統計量を言います。

平均値はお馴染なので良いでしょう。
分散と標準偏差は、二乗と平方根の関係であるため、意味としては同じです。
つまり、両方とも、データのばらつきを表す値です。
ただし、分散は計算の途中で二乗をしているため、元々のデータと単位が異なって
しまっています。このままでは、分かりにくい(たとえば平均値との比較もできない)
ため、分散のルートを取ることによって、元々のデータと同じ単位に戻します。
これが、標準偏差です。
通常、データの性質を表す際には、平均値と標準偏差を用います。

何故、平均値だけではダメなのかというと、以下のような場合、
A:【5, 5, 5, 6, 6, 6】mean = 5.5, SD =0.55 
B:【1, 1, 1, 1, 1, 28】mean = 5.5, SD =11.02 
平均値は同じでも、データの中身は大違いです。
しかし、SDが記述されていれば、データのばらつき度合いが分かるため、
データ全体がある程度は推測できます。

普通にt検定や分散分析統計を行う限りは、記述統計量はこの3つのみを
理解していれば十分です。受験生はちゃんと他の値も勉強しましょうね。


B統計的仮説検定

超簡単・心理統計の基礎@

February 18 [Wed], 2009, 17:23
数学大嫌いの文学少年のために、実際のどーのこーのはすっ飛ばして、
心理統計の基礎を徒然と書きなぐってみました。

文字ばかりで逆に読みにくいですが、グラフを作る勇気はありません。
臆病者、と罵られても、これが精いっぱいだ、とただ泣くばかりです。
ちなみに、実際の計算方法などは当然ですが載せていません。
t値だとかF値なんかも勿論書いていません。全てはSPSSがやってくれますから。
ここでは、統計を使用するに当たっての心構え的なものを書いています。
用語の詳しい説明や、「なぜ?」という問いには触れていないものが多いです。
そのような問いが浮かぶようになったら、本買って勉強してください。

心理学的にはt検定と分散分析が解ればいいんじゃないかなんて思うので、
二つだけしか紹介していません。相関なんて直観的にわかると思うので。
リクエストがあればどうぞ。でも難しいことは知りません。


A記述統計量
B統計的仮説検定
Ct検定
D分散分析


コメント意見批判ありましたら是非どうぞ。徐々に加筆修正していきます。
P R
プロフィール
  • ニックネーム:chrone
読者になる
“心理学系大学院へ行こう”では主に大学院入試対策向けの参考書や受験に役立つ知識を紹介しています。 大学院入試以外にも、心理学系のコラムや、心理統計の基礎についての記事もあります。卒論対策にも一読ください。

このサイトはリンクフリーです。相互リンクも募集しております。
現在、WEBサイト版”心理学系大学院へ行こう”を試験運用中です。
感想をお聞かせください。


This site is powered by blackcatstyle. 
blackcatstyle 管理人の趣味サイトです。
こちらもどうぞ
にほんブログ村 科学ブログへ