Last updated: 2014 -October 2009. Kajiyama                    [ 目次に戻る ]

対応のある2群の平均値の差に関するt検定 (1)「アンスタック形式」


  1. 対応のある2つの平均値を比べる

    対応があるデータとは,同じ人に複数回質問する場合を言う.

     ・成績(平均値)が,授業を受ける前と後で変わるか.

     ・ダイエットする前後の体重(平均値)に変化があるか.

    このほかに同じ人でなくても,

     ・一緒に生活している親子で環境問題に関する考え方に違いがあるか.

     ・双子の運動能力(平均値)に違いがあるか.


    表1  演歌を聴くことにより図形科学の成績は変化するか 10点満点

    ランダムに選んだ9人の学生に演歌を聞かせた.演歌を聞く前に空間認識テストAを行い,聞いた後1時間後に空間認識テストBを行った.

    演歌を聴くことにより学生の空間認識テストの成績(平均値)は変化するか.

    サンプル
    山田
    青井
    美空
    小酒井
    坂井
    富田
    土方
    10 9
    9 10
    9 8
    9 10
    7 8
    8 7
    6 7
    7 5
    5 7


  2. データフレームの読み込みと確認

    (1) データフレームの読み込み

    ここでは,「Web上の表シート」あるいは「エクセルの表計算シート」からクリップボード経由で読み込む操作を行う.

    Rの「コンソール」画面に,

    x <- read.table( "clipboard", header=TRUE   )   # header=TRUE は第1行が列の変数名

    と記述し, 次に,表1 [演歌を聴くことにより図形科学の成績は変化するか」の緑の部分をマウスで選択し,これをコピーする.

    そして,エンターキーを押す.

    コピーした[clipboard]データファイルを,Rの内部のデータフレーム,ファイル名 x に直接読み込む.


    (2) 読み込んだデータフレームの確認

    x #     と記述し,Rの内部に作成したデータフレーム x を,表示し確認する.

    
    > x <- read.table( "clipboard", header=TRUE )
    > x
       前   後
     1  10   9
     2   9   10
     3   9   8
     4   9   10
     5   7   8
     6   8   7
     7   6   7
     8   7   5
     9   5   7
    


    (3) データフレームの構造確認

    str (x) #     と記述し,Rの内部のデータフレーム x の変数の内容を表示確認する.

    
    > str (x)
    'data.frame': 9 obs. of  2 variables:
     $ 前:  int 10  9 9  9 7 8 6 7 5
     $ 後:  int  9 10 8 10 8 7 7 5 7
    


    (4) データフレームの基礎統計量

    summary (x) #     と記述し,Rの内部のデータフレーム x の要約統計量を表示確認する.

    apply (x[1:2], 2, var) #     と記述し, x の不偏分散を表示確認する.

    apply (x[1:2], 2, sd) #     と記述し, x の不偏標準偏差を表示確認する.

    
    > summary (x)
          前         後
     Min.  : 5.000   Min.  : 5.000
     1st Qu.: 7.000   1st Qu.: 7.000
     Median : 8.000   Median : 8.000
     Mean  : 7.778   Mean  : 7.889
     3rd Qu.: 9.000   3rd Qu.: 9.000
     Max.  :10.000   Max.   :10.000
    
    > apply (x[1:2], 2, var) # 不偏分散
          前       後 
    2.694444 2.611111 
    
    > apply (x[1:2], 2, sd) # 不偏標準偏差
          前       後 
    1.641476 1.615893 


    (5) 箱ひげグラフの作成  box-whisker plot

    boxplot ( x[,1], x[,2]) #     と記述し,変数ごとの分布を観察できる箱ひげグラフを作成する.

    boxplot ( x$前, x$後) #    でも同じ結果になる.

    男性の平均 7.8 女性の平均 7.9であるが,データのばらつきに違いがあるとは観察されない.平均値の違いを検定して確かめる.



  3. 分散の等質性の検定 「2群の分散が等しい場合・等分散を判別する」

    2群の分散が等しいか,あるいは等しくないかを検定する.2群の分散は等質であるとの帰無仮説を立てる.

    2群の分散が等しい場合,「t検定」を行ことができる.2群の分散が等しくない場合,「ウェルチのt検定」を行う.



    (1) Rの「コンソール」画面に,

    var.test ( x $ 前, x $ 後 ) # と記述し検定を行う.  var.test (データファイル名 $ 変数1,データファイル名 $ 変数2,)

    var.test ( x[,1], x[,2] ) #   と記述しても同じ.  var.test (データファイル名[ ,1],データファイル名[ ,2])

    > var.test ( x $ 前, x $ 後 )

    F test to compare two variances 2つの分散の比較のためのF検定

    data: x$前 and x$後
    検定統計量 分子の自由度 分母の自由度   p値 p-value = 0.9656
    F = 1.0319,  num df = 8,  denom df = 8,   p-value = 0.9656
    alternative hypothesis: true ratio of variances is not equal to 1 対立仮説は母分散の比が1ではない
    95 percent confidence interval:95%信頼区間の下限と上限の値
    0.2327666 4.5747469
    sample estimates:
    ratio of variances 標本から計算された分散の比
    1.031915


    (2) 結果の読み方

    分散の等質性の検定の結果 p値は0.97であり,帰無仮説は棄却できない.

    2群の分散が等しい「等分散」と判断できる. 「t検定」を行う.


  4. 対応のある 2群の平均値の差に関するt検定  (Two Sample t-test)

    (1) Rの「コンソール」画面に,

    t.test ( x[,1], x[,2], paired=TRUE ) #  と記述し検定を行う. t.test(データファイル名[ ,1],データファイル名[ ,2], paired=TRUE)

    t.test ( x$前, x$後, paired=TRUE ) #  と記述しても同じ.  t.test(データファイル名 $ 変数1,データファイル名 $ 変数2, paired=TRUE)

    > t.test(x[,1],x[,2], paired=TRUE)

    Paired t-test           対応のあるt検定

    data: x[, 1] and x[, 2]            データファイル x の変数1と2
    t = -0.2443, df = 8, p-value = 0.8131   検定統計量t = -0.2443 自由度 df = 8, p値 p-value = 0.8131
                                                    両側検定 前>後 前<後
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval: 95%信頼区間の下限と上限の値
    -1.1597476    0.9375254
    sample estimates:
    mean of the differences 標本平均値の差
     -0.1111111



    (2) 結果の読み方

    演歌を聴く前後の成績の平均点 には差がないという帰無仮説を立てる.

     ・p値は 0.8である.有意水準は5%とすると p = 0.8>0.05 と5%より大きいので帰無仮説は棄却できない.

     ・検定結果は有意でない.

    前後の標本平均の差=-0.1 で,絶対値を取ると0.1である.演歌を聞いた前後で成績に差があるとはいえない.

    癒しの演歌を聴くことにより図形科学のテストの成績に変化を起こすとはいえない.まじめに頑張ろう.

対応のある2群の平均値の差に関するt検定 (1)「アンスタック形式」   [ 目次に戻る ]