片側検定を使うべきでない理由

　片側検定は使うべきではないと思っています。

　その理由を述べますので、詳しい方ちょっと反論してもらえませんでしょうか？

例えば、上のサイトでは

今回の例では、ダイエット薬の効果を確かめたいので、通常はその２の対立仮説を使って、片側検定を行います。

ダイエット薬は体重を減らす方向にしか働かないとするならば、片側検定を使えとあります。

　私はこれに違和感を覚えます。説明しますので、ちょっと反論してもらえませんか？みなさんの反論を通じて片側検定への理解がネットで共有できると良いなぁと思います。

　具体的に例題を使って話を進めます。小学生に授業前の予習時間の効果を検定するとします。

　とあるクラスAの生徒は毎日1時間の予習をさせます（簡単のため、他のクラスの生徒は予習時間ゼロとします）。一年後、学力テーストを実施して、予習時間の効果を検定します。

　仮説検定とは帰無仮説（学習時間の効果が無い）に基づき検定統計量を算出し、それが確率的に低いと判断した場合には、対立仮説を採択するものです。

　例題では、帰無仮説として他のクラス（予習時間ゼロ）の生徒の学力テストの結果の分布が、クラスA（予習時間1時間）にも当てはまると考えます。

　例えば、下のような分布になったとします（横軸：学力テストの点数、縦軸：確率）。そしてクラスAの学力テストの平均店が下の矢印だとします。

　予習時間の効果は無いという仮定（帰無仮説）ですから、高得点側にも低得点側にもばらつく可能性があるため、両側検定を使って検定することになるでしょう。

　今回の場合、有意水準5%とすると帰無仮説を採択し、予習による学習効果は認められないという結論になります。

f:id:kota2009:20170722085857p:plain

　一方、上のダイエットの例になぞらえば、予習してテストの点数が悪くなることはなさそうなため、片側検定を使ってもよさそうです。そうすると、下のように学習効果があるという結論になります。

　しかし、そもそも帰無仮説は学習効果はないというものですから、学習していないクラスの確率分布をもとにして、学力減少側の事象を捨てるのは不合理でしょう。

f:id:kota2009:20170722090928p:plain

　このように考えると、片側検定の出番は、帰無仮説に基づいて計算する統計量（今回はクラスAの学力テストの結果の平均値）がプラス側にしか出ない場合だけです。それは、上の例のダイエットの薬ではないでしょう（たまたま体調を崩す等で体重を減らす被験者がいるため）。

　すると、片側検定を使う場面って無いように思えるのです。

　いかがでしょうか？

kotaの雑記帳