Last updated: October 2009. Kajiyama                    [ 目次に戻る ]

対応のある2群の平均値の差に関するt検定 (2)「スタック形式」


  1. 対応のある2つの平均値を比べる

    対応があるデータとは,同じ人に複数回質問する場合を言う.

     ・成績(平均値)が,授業を受ける前と後で変わるか.

     ・ダイエットする前後の体重(平均値)に変化があるか.

    このほかに同じ人でなくても,

     ・一緒に生活している親子で環境問題に関する考え方に違いがあるか.

     ・双子の運動能力(平均値)に違いがあるか.


    表1  演歌を聴くことにより図形科学の成績は変化するか 10点満点

    ランダムに選んだ9人の学生に演歌を聞かせた.演歌を聞く前に空間認識テストAを行い,聞いた後1時間後に空間認識テストBを行った.

    演歌を聴くことにより学生の空間認識テストの成績(平均値)は変化するか.

    このデータフレームを「アンスタック形式」と呼び区別する.

    サンプル
    山田
    青井
    美空
    小酒井
    坂井
    富田
    土方
    10 9
    9 10
    9 8
    9 10
    7 8
    8 7
    6 7
    7 5
    5 7


  2. 「スタック形式」のデータフレームの読み込みと確認

    (1) 「スタック形式」のデータフレームの作成

    「スタック形式」のデータフレームでは前後別の「群の変数」とその値の「測定値の変数」の形式にする.

    表2  演歌を聴くことにより図形科学の成績は変化するか

    サンプル
    山田
    青井
    美空
    小酒井
    坂井
    富田
    土方
    山田
    青井
    美空
    小酒井
    坂井
    富田
    土方
    測定値
    10
    9
    9
    9
    7
    8
    6
    7
    5
    9
    10
    8
    10
    8
    7
    7
    5
    7


  3. データフレームの読み込みと確認

    (1) データフレームの読み込み

    ここでは,「Web上の表シート」あるいは「エクセルの表計算シート」からクリップボード経由で読み込む操作を行う.

    Rの「コンソール」画面に,

    x <- read.table( "clipboard", header=TRUE   )   # header=TRUE は第1行が列の変数名

    と記述し, 次に,表2 [ 演歌を聴くことにより図形科学の成績は変化するか」の緑の部分をマウスで選択し,これをコピーする.

    そして,エンターキーを押す.

    コピーした[clipboard]データファイルを,Rの内部のデータフレーム,ファイル名 x に直接読み込む.


    (2) 読み込んだデータフレームの確認

    x #     と記述し,Rの内部に作成したデータフレーム x を,表示し確認する.

    > x <- read.table( "clipboard", header=TRUE )
    > x
         測定値   群
     1   10   前
     2   9   前
     3   9   前
     4   9   前
     5   7   前
     6   8   前
     7   6   前
     8   7   前
     9   5   前
    10    9   後
    11   10   後
    12    8   後
    13   10   後
    14    8   後
    15    7   後
    16    7   後
    17    5   後
    18    7   後
    


    (3) データフレームの構造確認

    str (x) #     と記述し,Rの内部のデータフレーム x の変数の内容を表示確認する.

    > str (x)
    'data.frame':   18 obs. of  2 variables:
     $ 測定値: int     10  9  9  9  7  8  6  7  5  9 ...
     $ 群  :  Factor  w/ 2 levels  "後", "前": 2  2  2  2  2  2 2  2  2  1 ...
    



    (4) データフレームの基礎統計量

    by ( x$測定値, x$群, summary ) #     と記述し,Rの内部のデータフレーム x の要約統計量を表示確認する.

    by ( x$測定値, x$群, var ) #     と記述し, x の不偏分散を表示確認する.

    > by ( x$測定値, x$群, summary )
     x$群: 後
     Min.  1st Qu. Median  Mean   3rd Qu.  Max.
     5.000  7.000  8.000  7.889  9.000   10.000
    -------------------------------------------------------------------
     x$群: 前
     Min.  1st Qu. Median  Mean   3rd Qu. Max.
     5.000  7.000  8.000  7.778  9.000   10.000
    
     > by (x$測定値, x$群, var ) # 不偏分散
    x$群: 後
    [1] 2.611111
    ----------------------------------------------------------- 
    x$群: 前
    [1] 2.694444
    


    (5) 箱ひげグラフの作成  box-whisker plot

    boxplot ( 測定値 ~ 群, data=x ) #     と記述し,変数ごとの分布を観察できる箱ひげグラフを作成する.

    女性の平均 7.9 男性の平均 7.8のデータのばらつきに違いがあるとは観察されない.平均値の違いを検定して確かめる.


  4. 分散の等質性の検定 「2群の分散が等しい場合・等分散を判別する」

    2群の分散が等しいか,あるいは等しくないかを検定する.2群の分散は等質であるとの帰無仮説を立てる.

    2群の分散が等しい場合,「t検定」を行ことができる.2群の分散が等しくない場合,「ウェルチのt検定」を行う.

    (1)Rの「コンソール」画面に,

    var.test( x$測定値 ~ x$群 ) # と記述し検定を行う.var.test (データファイル名 $ 変数1 ~ データファイル名 $ 変数2 )

    var.test ( x[,1] ~ x[,2] ) #    と記述しても同じ.var.test (データファイル名[ ,1] ~ データファイル名[ ,2], ) 変数1は測定値, 変数2は群

    > var.test ( x$測定値 ~ x$群 )

    F test to compare two variances           2つの分散の比較のためのF検定

    data: x$測定値 by x$群                  データの変数
    F = 0.9691, num df = 8, denom df = 8, p-value = 0.9656
    検定統計量F 分子の自由度 num df, 分母の自由度 denom df, p値
                                              両側検定 男性>女性 男性<女性
    alternative hypothesis: true ratio of variances is not equal to 1    対立仮説は母分散の比が1ではない
    95 percent confidence interval:                       95%信頼区間の下限と上限の値
     0.2185913         4.2961488
    sample estimates:
    ratio of variances                            標本から計算された分散の比
     0.9690722


    (2) 結果の読み方

    分散の等質性の検定の結果 p値は0.97であり,帰無仮説は棄却できない.

    2群の分散が等しく「等分散」と判断できる. 「t検定」を行う.


  5. 対応のある 2群の平均値の差に関するt検定  (Two Sample t-test)

    (1) Rの「コンソール」画面に,

    t.test ( 測定値 ~ 群, x, paired=TRUE ) #  と記述し検定を行う. t.test(変数1, 変数2, データファイル名, paired=TRUE )

    > t.test ( 測定値 ~ 群, x, paired=TRUE )

    Paired t-test           対応のあるt検定

    data: 測定値 by 群            データファイル x の測定値 と 群
    t = 0.2443, df = 8, p-value = 0.8131   検定統計量t = -0.2443 自由度 df = 8, p値 p-value = 0.8131
                                                    両側検定 前>後 前<後
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:       95%信頼区間の下限と上限の値
    -0.9375254       1.1597476
    sample estimates:
    mean of the differences             標本平均値の差
     0.1111111


    (2) 結果の読み方

    演歌を聴く前後の成績の平均点 には差がないという帰無仮説を立てる.

     ・p値は 0.8である.有意水準を5%とすると p = 0.8>0.05 と5%より大きいので帰無仮説は棄却できない.

     ・検定結果は有意でない.

    前後の標本平均の差 0.1 であり,前後で差があるとはいえない.

    演歌を聴くことにより図形科学のテストの成績に変化を起こすとはいえない.まじめに頑張ろう.

対応のある2群の平均値の差に関するt検定 (2)「スタック形式」   [ 目次に戻る ]