Last updated: October 2008. Kajiyama                    [ 目次に戻る ]

統計的仮説検定  Testing of statistical hypothesis


  1. 統計的仮説検定の考え方  (仮説検定あるいは検定とも呼ばれる)

    集めた標本(データ)で見られる差や違いや関連が,母集団でも認められる差や違いや関連であるかを推測し判断する手続きである.

    言い換えると,母集団についてのある仮説が,正しいか,間違っているかを統計的に判断する方法である.

    (1) はじめに2つの変数間で,あるいは2つのグループ間(実験群と対照群)には「差が無い・効果が無い・違いが無い」という仮説を立てる.

    (2) 実際の結果が,その仮説が正しいという条件の下では,確率的にめったに起こらないものであったとき,

    (3) はじめに立てた仮説が間違っていると判断する.


  2. 統計的仮説検定の手順

    (1) 実験群と対照群には「差が無い」という帰無仮説を立てる.

    (2) 仮説が間違っているか正しいかの判断基準となる低い確率α (有意水準)を決める.α=0.05

      ・ 低い確率(どの程度まれに起こるものか)の値が出たら帰無仮説を棄却するかという基準が有意水準である.

      ・ 有意水準を分岐点とし,帰無仮説の棄却域と採択域を区分する.

    (3) 統計量を決め,実際のデータから,標本の統計量を計算する.

      ・ 調査より得られたデータ(平均,分散,相関係数)から,標本の統計量を計算し,

        その値以上の統計量が得られる確率(有意確率またはp値)を求める.

    (4) 標本統計量の数値(p値)と有意水準を比較し,

      ・ 統計量が採択域に入れば,帰無仮説を採択し,棄却域に入れば帰無仮説を棄却する.

      ・ 言い換えると,最初に立てた「差が無い」という帰無仮説が,間違っているか正しいかを判断する.


  3. 帰無仮説(a null hypothesis)と対立仮説(an alternative hypothesis)

    (1) 実験群と対照群には「差がある」ことを期待して,実験群と対照群を研究対象にする.

    (2) 実験群と対照群には「差が無い」という仮説を設け,この仮説は正しくないとして棄却することを期待する.

    ・ 棄却されることを目的に作られる仮説のことを帰無仮説(記号は H0 無に帰する仮説)という.

    ・ 帰無仮説が捨てられたときに採択される仮設を対立仮説(記号は H1)という.

    ・ 対立仮説は実証したい作業仮説または実験仮説である.


  4. 標本統計量検定統計量

    ・ 標本から計算される値を標本統計量(a sampling statistic)と呼ぶ.

    ・ 統計的仮説検定のために用いる標本統計量(t,F,χ2)のことを検定の統計量(a test statistic)と呼ぶ.

      平均値の差の統計量はt,分散の差はF,度数や%の差はχ2が用いられる.

      t,F,χ2 の値は理論的な分布(正規分布,t分布,F分布,χ2分布)に依存していると仮定する.

      これら分布に依存する検定はパラメトリック検定法と呼ばれる.分布に依存しないものをノンパラメトリック検定法と呼ぶ.


  5. 有意水準(a significance level / a level of significance)

    どの程度,低い確率の統計検定量の結果が出たら,「差が無い」という帰無仮説を棄却するかという基準になるのが有意水準である.

    ・有意水準は,5%あるいは1%に設定する.

    ・有意水準の表記はαで,α=0.05と記述するときは,有意水準は5%をあらわしている.


  6. 両側検定と片側検定

    ・ 検定統計量の標本分布の両すそ部分を棄却域とする検定のことを両側検定 (a two-tailed test / a two-side test)という.

    ・ 右または左の片側だけのすそを棄却域とする検定を片側検定 (a one sided test)という.

    研究では以下の理由で両側検定を選択する.

    (1) 「実験群>対照群」でも「実験群<対照群」でもどちらでかまわない場合,

       グループ間に差があることを示したいときに,両側検定を使用する.両側あわせて5%の範囲.

    (2) 「実験群>対照群」だけを考え「実験群<対照群」を考えないときは,片側検定を使用する.片側で5%.

    (3) どちらをとるかは仮説の立て方による.研究では両方のケースを想定するので両側検定になる.


  7. Rの検定結果(A test result)と帰無仮説の判断,論文記述

    (1) p≦αのとき,帰無仮説を棄却し対立仮説を採択する.

    まれに起こる確率αよりもp値が低いので,帰無仮説は成り立たないと判断し棄却する.

    ・ 「検定結果は5%水準で有意である.」または,「実験群と対照群の成績にはp<.05で有意差が見られた」

    ・ 「図表には斜体で sig. あるいは p<.05」と記述する.

    ・ p値は小数点以下2〜3桁程度でよい.

    ・ p値が0.001より小さいときには,p<.001のように書く.

    (2) p>αのとき,帰無仮説を採択する.

    まれに起こる確率αよりもp値が高いのでので,帰無仮説は棄却できないと判断する.

    ・ 「検定結果は有意でない.」または,「実験群と対照群の成績には有意な差は見られなかった」

    ・ 「図表には斜体で n.s.」と記述する.

    ・ 「実験群と対照群の成績には差はない」と書いてはいけない.検定は,今のデータに基づく結論を述べたもので,

      データ数が増えれば,差が検出できるかもしれない.

    (3) 効果量を検討する.

    ・ p値は標本数(サンプル・サイズ)の影響を受けやすく,標本数を多くするとp値は低くなり「有意である」分析結果が現れる.

    ・ このp値は,「差の大きさ」は検討していない.p値が低ければ低いほど「差が大きい」と効果の大きさを推測することは誤解である.

    ・ 誤った推理をしないために,さらに,この差の大きさ,あるいは効果量(効果の大きさ:effect size)を検討する.


  8. 統計的仮説検定における二種類の誤り

    (1) 第一種の誤り α 

    棄却域であっても帰無仮説の元では低い確率で生じることがある.

    ・ このような帰無仮説が正しいのに,帰無仮説を棄却してしまう誤りがある.

    ・ この確率をαで表記し,危険率・有意水準と呼ぶ.

    (2) 第二種の誤り β 

    ・ 帰無仮説が誤っているのに,帰無仮説を採択してしまう誤りである.

    ・ この確率をβで表記し,1−βは,帰無仮説が誤っているのに帰無仮説を採択する確率である.1−βを検定力(検出力:power)と呼ぶ.


  9. 有意水準・標本数・効果量・検定力の4指標の関係

    検定力 = f (標本数,効果量,有意水準)  標本数 = f (効果量,有意水準,検定力)

[ 目次に戻る ]