D三群以上の平均値の比較(分散分析)
三群以上の平均値の差の比較の検定には分散分析を用います。
たとえば、指導法A,B,Cの違いを、A群とB群とC群の英語の成績を用いて検定するような場合です。
または、指導法A,Bの違いを、A群とB群の英語と国語の成績を用いて検定したいような場合です。
ちなみにここでは、「組」という要因の影響は抜いて考えています。
前者を1要因3水準、後者を2要因2水準の分散分析といいます。なんじゃこりゃ。
用語の説明に入る前に、ひとつ重要なことを述べておきます。
分散分析は、要因の効果があるか、ないかを検定する統計法です。とりあえず覚えていてください。
・要因と水準
要因とは、従属変数に与える影響(独立変数)の種類のことです。
前者の例の場合、独立変数は「指導法」のみだから1で、後者の例の場合は、
独立変数は「指導法」と「教科」だから2になります。
水準とは、一つの要因(独立変数)における種類の数です。
前者は、三種類の指導法があったので、3です。後者では、指導法はA,B2つ、教科は英語と国語の2つ。
分散分析においても対応の有無が問題になり、被験者内要因か被験者間要因であるかを考慮します。
同じ被験者が異なる水準のデータにも登場するならば被験者内要因です。
前者の例を見てみると、指導法の水準3つを3つの群に割り振っています。
ということは、3つの水準のデータは、異なる被験者から出ていることになるので、これは被験者間です。
後者の例では、指導法はA群とB群で異なる被験者なので、被験者間要因。
一方、教科はA群内、B群内で共通の被験者が出すものなので、被験者内要因です。
ひとつの実験計画に被験者内要因と被験者間要因が含まれている時には混合計画と言います。
だから前者は被験者間要因で1×3の分散分析、後者は混合計画で2×2分散分析とか言います。
・主効果と交互作用
分散分析にはt検定にない新たな問題が出てきます。それが、主効果と交互作用という問題です。
主効果とは要因単独の効果で、交互作用とは要因が二つ以上絡み合った効果を指します。
とりあえず先程の、2×2の分散分析の例で考えてみましょう。
指導法の主効果、というのは指導法Aを導入したA群の成績の方がB群よりも
英語と国語の両方において高く(低く)なることで示されます。
一方、教科の主効果とは、A群においてもB群においても、英語の方が国語の点数よりも
高い(低い)ようなことを言います。
有意な教科の主効果が見られた時に言えることは、どちらかのテストが簡単だった、ということです。
さて、次に交互作用ですが、英語の成績に関しては、A群はB群よりも高かったのだけれど、
国語の方では変わらなかった、いや、逆にB組より低かった。なんて場合に登場します。
こんな時には、交互作用が有意になります。
そして、指導法Aは英語にのみ効果が見られた、という結論が出てきます。
さて、主効果も交互作用も有意になったときは、どう考えればいいでしょうか?
そんな時は、主効果が有意だったとしても主効果についての検討は避けろ、とよく言われます。
つまり、片方の水準の効果がもう一方のダメだった方の水準の効果をカバーして
全体としての主効果を有意にした可能性があるために、
ほんとに主効果があったのかどうかがわからないのです。
交互作用を抜きにして要因の効果に検討したいときは、単純主効果の分析というものを行います。
単純主効果とは、特定の水準における、主効果の分析です(=1要因の分散分析です)。
・多重比較
交互作用が出た時、多重比較というものを行います。
また、交互作用が出なくても、仮説検証に必要であれば、多重比較を行います。
多重比較とは、全体の効果ではなく、どことどこの間に差があるかを細かく見るものです。
なので、上に挙げたような単純主効果の分析というやつも、多重比較で行えます。
一般に多重比較という言葉は、3水準以上ある要因について、どの水準とどの水準の間に
効果があるのかを調べる時に使うようです。以下に具体例を見てみましょう。
最初の方の1要因3水準の例を見てみます。
要因の主効果が有意になったということは、A,B,C群に差がないとは統計的に言えない、
ということを意味します。とっても回りくどいのです。
では、具体的に、どことどこに差があったのか。これを多重比較で調べます。
多重比較とは、ある方法を用いて、t検定を繰り返す統計法です。
t検定を単純に繰り返すことができないことについては、他で解説します。
このケースではAとB、AとC、BとC、と3回比較をします。これが比較いっぱい多重比較。
二番目の2要因2水準の例が2つの要因の主効果、交互作用ともに有意になったとしましょう。
交互作用が有意になったので、考察において「指導法に効果があった」とそのまま結論することは
できません。交互作用とは、主効果ちょっと待った作用、という感じです。ここで多重比較を行います。
普通は、A1とA2の比較、およびB1とB2の比較をします。
ただし、理論的にはA1とA2、A1とB1、A2とB2、B1とB2という全ての対の比較が可能です。
(A1=指導法A・教科1…と考えてください)
今回挙げた例(2水準の場合)では、多重比較=単純主効果の分析となります。
主効果や交互作用が有意でなくとも、分析の方法によっては多重比較でどこかが有意になることはあり得ます。
結局、統計においては、「何をすればいいのか」ではなく、仮説検証において、
「何の効果が見たいか」ということが大事なのです。