Post-hoc test

statistics/mean/anova_post_hoc
2-20-2016 updated


  1. 概要: Post-hoc test とは
  2. Post-hoc test としての多重比較検定
    • Bonferroni test
    • Fisher's LSD test
    • Tukey, Tukey-Kramer test
    • Newman-Keuls test
    • Duncan's multiple range test
    • Dunnet test
統計の基礎
t 検定を理解するために

以下の順番に読んでみて下さい。

  1. 仮説検定
  2. z 検定
  3. t 検定の原理 - 母平均の検定
  4. 対応のある t 検定
  5. t 検定 のメインページ: 等分散の場合
  6. Welch の t 検定: 分散が同じと言えない場合
  7. Mann-Whitney の U 検定
  8. t 分布
  9. 実践: Excel での t 検定, 平均値と分散を用いた t 検定
その他の検定




概要: post-hoc test とは

事後検定 post-hoc test とは,通常 ANOVA ののちに行われる多重比較の群間検定のことである。

Dunnet, Tukey-Kramer, Bonferroni は F 統計量を用いない多重比較であるため,ANOVA で有意でなくても有意差が出ることがある (3)。これらについては,前もって ANOVA をかける必要がない。

一方,Scheffe, Games/Howell, Fisher PLSD は F 統計量を用いているため,前もって ANOVA をかける必要があり,ANOVA で有意でなければ有意差は出ない (3)。


早見表

この表の作成時には,文献 2 「私のための統計処理」を大いに参考にさせて頂きました。

Test 母集団の分布 分散 特徴
Bonferroni 正規分布 等分散 5 群以上では使わない方が良い。
Fisher's LSD 4 群以上では使えない。
Tukey, Tukey-Kramer もっとも一般的な post-hoc test である。
Steel-Dwass 制限なし 制限なし Tukey-Kramer の non-parametric 版。
Newman-Keuls
Duncan's MRT Multiple range test。第 2 種の過誤に堅牢だが,第 1 種の過誤のリスクが大きい。
Dunnet 対照群とその他の群の比較。


Post-hoc test としての多重比較検定

ボンフェローニの検定 Bonferroni test

検定の多重性を調整する方法のひとつで,有意水準を直接いじる 最もわかりやすい方法である (3)。

  • 3 群で仮説を検定する場合,2 群の組み合わせの検定を 3 回繰り返す必要がある。このときには,有意水準 0.05 を 3 で割って 0.017 とする。
  • 同様に,4 群の場合は 6 回の検定が必要なので,0.05/6 = 0.0083 を有意水準とする。

群が増えると有意水準がどんどん低くなり,厳しくなりすぎるという問題がある。5 群以上の検定では用いるべきではないとされているが,この点を改良したのが Holm 法,Shaffer 法である (3)。


Fisher's LSD

多重性の問題が考慮されていないため,3 群のみに限定される (3)。


Tukey および Tukey-Kramer 法

Tukey 法は各群の n が揃っている場合,Tukey-Kramer 法は揃っていない場合の検定である (3)。後者は n が揃っている場合でも検定できる。Tukey HSD 法も同じ検定のことであり,HSD は honestly significant difference の略である。

Newman-Keuls test

ダンカンの多重比較検定 Duncan's multiple range test

Newman-Keuls を発展させて作られた検定である。

Wikipedia には 「Duncan's new multiple range test (MRT) などとも呼ばれる多重比較法。第 1 種の過誤 type I error のリスクを高めることを許容し,第 2 種の過誤 type II error に対して堅牢 protective な検定である」とあるが,文献 3,4 では 多重性の問題を考慮していないため使用すべきではない と書かれている。

なぜ多重性の問題を考慮していないと言われるかは,文献 4 で詳しく解説されている。英語では少し異なる表現がされているようで,このページ などでは type I error を意図的に増やして Newman-Keuls の問題点を解決しようとしていると書かれている。

"Duncan's MRT does not control family wise error rate at the nominal alpha level, a problem it inherits from Student–Newman–Keuls method. The increased power of Duncan's MRT over Newman–Keuls comes from intentionally raising the alpha levels (Type I error rate) in each step of the Newman–Keuls procedure and not from any real improvement on the SNK method."


References

  1. 山中ら 2009a. 分子生物学,生化学,細胞生物学における統計のポイント. 蛋白質核酸酵素 53, 1792-1801.
  2. 私のための統計処理. Link.
  3. 池田 2013a. 統計検定を理解せずに使っている人のために III. 化学と生物 51, 483-495.
  4. 山村 1998a. 土壌肥料学における数理統計手法の応用上の問題点. 3. Duncanの多重検定はなぜ使えないか. 日本土壌肥料学会誌,69, 649-653, 1998. CiNii open access paper. 広告付きリンク.

広告付きリンクとは:
広告ページを経由してリンク先に飛ぶことで,私にごくわずかな広告収入が入ります。サイトを更新するモチベーションの維持にご協力頂ける方はこちらを,お急ぎの方は普通のリンクをクリックして下さい。見つけるのが大変だったページは広告付きリンクのみを貼ってある場合もありますのでご了承下さい。

コメント欄

全ページ共通なので,コメントにはページのタイトルもつけて下さい。書き込みのあったページには,専用のコメント欄を割り当てます。詳細は こちら のページに。

inserted by FC2 system