仮説検定

statistics/basic/hypothesis
12-18-2015 updated


  1. 仮説検定の手順
  2. 白鳥の例え
  3. 歴史
関連項目
t 検定を理解するために

以下の順番に読んでみて下さい。

  1. 仮説検定: このページ
  2. z 検定
  3. t 検定の原理 - 母平均の検定
  4. 対応のある t 検定
  5. t 検定メインページ: 等分散の場合
  6. Welch の t 検定: 分散が同じと言えない場合
  7. Mann-Whitney の U 検定
  8. t 分布
  9. 実践: Excel を用いた t 検定, 平均値と分散を用いた t 検定


仮説検定とは

仮説検定とは,母集団に関して立てた 仮説が間違いであるかどうか を,標本調査の結果をもとに検証することである (1)。大まかに,以下のような段階を踏む。

  1. 仮説を設定する
  2. 検定統計量を求める
  3. 判断基準を定める
  4. 仮説を判定する
 

なぜ,わざわざ否定するための仮説を立ててから,それを否定するという面倒な形をとるのかは,ページ下方の「白鳥の例え」を参考にすると分かりやすい。


1. 仮説を設定する

検定を行う人は,2 つの仮説,帰無仮説 null hypothesis (H0) と,対立仮説 alternative hypothesis (H1) を設定する。

帰無仮説は,主に否定したいことを定義する仮説で,通常は等式で表せる形式で設定する。

  1. 喫煙者と非喫煙では,体重に差がない。両者の体重をそれぞれ BwS および BwNS と置くと,BwS = BwNS。
  2. ある地域のスーパーマーケットの昨年の卵 1 パックの平均価格は 117 円であった。今年の平均価格 m も同じく 117 円である (1)。 (m = 117)

対立仮説は,帰無仮説と背反関係 (同時に成り立たないということ) にある仮説のことをいう。上の帰無仮説と対応して,

  1. まず考えられるのは,BwS ≠ BWNS である。
    しかし,BwS > BWNS や BwS < BWNS も帰無仮説と背反関係にあり,対立仮説として用いることができる。つまり,可能な対立仮説は
    • BwS ≠ BWNS。これは「BwS > BWNS または BwS < BWNS」と同等である。
    • BwS > BWNS
    • BwS < BWNS
    の 3 つである。一番上の仮説を用いる検定を両側検定,下の 2 つのうちいずれかの仮説を用いる検定を片側検定という。
  2. 同じ論理により,m ≠ 117, m > 117, m < 117 の 3 通りの対立仮説がある。

ただし,1 回の検定で設定できる対立仮説は 1 個だけである。この後は帰無仮説を正しいと仮定して検定統計量を求め,その出現確率から帰無仮説を棄却するという流れになる。


2. 検定統計量を求める

検定統計量 test statistic とは,検定に使うデータを要約したものである (1)。統計的に表現すると「確率変数 random variable を標準化したもの」ということができるらしい。

検定統計量には,例えば以下のようなものがある。検定統計量の名前 (z 値,t 値など) がそのまま検定の名前 (z 検定, t 検定) として使われることが多いようである。


z value z 検定に用いる検定統計量,z 値。 z value t 検定に用いる検定統計量,t 値。



3. 判断基準を定める

検定統計量は適当に定められたわけではなく,正規分布 normar distribution や t 分布 t distribution など 何らかの分布に従うように設定された数 である。したがって,その分布の形から,「今回の実験で得られた検定統計量 (たとえば 2.1) が発生する確率 probability」を求めることができる。

この確率は P 値 P value と呼ばれる。P 値が有意水準 level of significance と呼ばれる値よりも低いとき,一般に「帰無仮説が棄却された」ということになる。

これは,「帰無仮説では説明できないほど珍しいことが起きた」ということである。有意水準としては 5% (0.05) や 1% (0.01) がよく用いられる。この値を予め設定しておく。


4. 仮説を判定する

最後に,得られた検定統計量および有意水準を用いて,仮説を判定する。具体例の方がわかりやすいと思うので,z 検定 のページを参照して頂きたい。


白鳥の例え: なぜわざわざ否定するための仮説を立てるのか?

集めてきたデータを使って,設定した仮説が正しいことを証明するのは難しい ためである (2)。文献 2 の白鳥の例を紹介する。

例えば,「白鳥は白い」という仮説が正しいことを証明するのはどうすればいいだろうか? 仮に 100 羽の白鳥を集めてきて,それが全て白かったとしても,これは仮説の証明にはならない。今回のサンプルに,たまたま黒い白鳥が含まれていなかっただけかもしれない。

サンプルが 1000 羽になっても 10000 羽になっても同じである。この仮説を証明するには,世界中の全ての白鳥について調査を行わねばならず,これは標本調査ではないため,仮説検定とは無縁な研究になる。

一方,仮説を否定することは容易である。この場合, (実際に見つけることが容易かどうかわからないが) 黒い白鳥を 1 羽みつけてくればよいわけである。

そのために,仮説検定では帰無仮説を「否定する」ためのデータを集めてくることになる。


いらすとや


歴史

仮説検定の考え方は,1933 年にネイマンとピアソンによって提唱された (3)。


References

  1. MATLAB による仮説検定の基礎. Web pdf.
  2. 佐藤弘樹,市川度 2013.
  1. なるほど統計学園高等部. Link.


コメント欄

全ページ共通なので,コメントにはページのタイトルもつけて下さい。書き込みのあったページには,専用のコメント欄を割り当てます。詳細は こちら のページに。

inserted by FC2 system