Last updated: 2015 - 2014. Kajiyama                    [ 効果量目次に戻る ]


パッケージcompute.es/pwrによる比率の差の効果量計算


@ cohen's h = 2*asin(sqrt(p1)) - 2*asin(sqrt(p2))

A オッズ比 OR = (p1*(1-p2))/ (p2*(1-p1)),d = (log(OR)*sqrt(3))/(pi)


1. 効果量計算の参考資料
  1. パッケージ"compute.es "英文マニュアル 2015 pdf  他の文献をもとに用語,関数式きちんと確認整理すること
  2. パッケージ"pwr"英文マニュアル p21 pdf  他の文献をもとに用語,関数式きちんと確認整理すること
  3. "検定力分析入門 Rで学ぶ最新データ解析", 豊田秀樹 編著,東京図書,2009. -検定の種類毎の効果量計算の解説がある.
  4. "伝えるための心理統計 効果量・信頼区間・検定力", 大久保街亜(まちあ),岡田謙介,勁草書房,2012.


2. 二群の比率の差の検定
    福岡市と山口市で私の好きなHKTの「コンサートに行きましたか」の架空調査がある.福岡市では350名中126名が行ったと答えた.

    山口市では380名中108名が行ったと答えた.福岡・山口の都市間でHKTのコンサートに行く人の割合に差があるか.


    表 HKTのコンサートに行きましたか

    有り	無し	合計
    第1群	126	224	350 
    第2群	108	272	380
    


    (1) 比率の差の検定

    > x <- read.table("clipboard", header=TRUE) #表をクリップボートにコピーし,データフレームを作成
    
    > x     # 入力したデーフレームの確認
    
          群 有り 無し 合計
    1 第1群  126  224  350
    2 第2群  108  272  380
    
    > prop.test(x[,2],x[,4], correct="False") #デーフレームの2列と4列を「比率の差の検定式」に読込
    
            2-sample test for equality of proportions without continuity correction
    
    data:  x[, 2] out of x[, 4]
    X-squared = 4.805χ, df = 1, p-value = 0.02838 p値<.05で有意
    alternative hypothesis: two.sided両側検定である
    95 percent confidence interval 95%信頼区間:
     0.00807447 0.14350448
    sample estimates:
       prop 1    prop 2 2群の比率
    0.3600000 0.2842105 
    


    (2) 検定結果と評価

    第1群(福岡市)の比率p1=0.36,第2群(山口市)の比率p2=0.28,2群の比率の差=0.08である.

    p値=.03であり5%の水準で有意であり,2群の比率に違いがあるといえる.

    次に,2群の比率の差=0.08について,その違いに実質的な差があるかを効果量で検討する.

3. 比率の差の検定結果から二群の比率の差の効果量を計算



 群		疾病有り	疾病無し	  合計

第1群暴露あり	a		b	a+b 
第2群暴露なし	c		d	c+d


医療統計や疫学統計で用いられる二値変数間の考え方 危険度(リスク)

リスク比(risk ratio):RR = (a/(a+b))/(c/(c+d)) = p1 / p2
第1群のリスク:p1 = a/(a+b), 第2群のリスク:p2 = c/(c+d)

オッズ比(odds ratio):OR = (a/b)/(c/d) = (a/c)/(b/d) = (p1*(1-p2))/(p2*(1-p1))
第1群のオッズ = a/b, 第2群のオッズ = c/d

オッズ比も効果量の指標である.




a. パッケージpwrの「ES.h関数」を使用したCohen's hの効果量計算

比率の差の検定結果から,

二群の比率の差の効果量Cohen's Effect Size "h"を計算する.

(1) パッケージpwrのインストールとパッケージをRの内部に読み込む

・統計パッケージpwrをコンピュータに追加インストールする.

library (pwr) # と記述し,パッケージをRの内部に読み込む.


(2) 比率の差の効果量Cohenのhを計算する関数 ES.h( ) の内容と使用法を確認.

help(ES.h) # と記述し効果量の計算のパラメータの解説が表示される.

? ES.h # と記述しても同じである.

> library (pwr) # R内部に読み込む

> help(ES.h) # 

ES.h関数の使用法
ES.h(p1, p2)

基本統計量から次の変数をES.h関数に入力
p1 	第1群の比率 First proportion.
p2 	第2群の比率 Second proportion.


ES.h関数で出力される効果量

Cohen's Effect Size "h" = 2*asin(sqrt(p1)) - 2*asin(sqrt(p2))

The corresponding effect size h

*1 パッケージ"pwr"英文マニュアル p21 pdf  他の文献をもとに用語,関数式きちんと確認整理すること.
*2 "検定力分析入門 Rで学ぶ最新データ解析", 豊田秀樹 編著,東京図書,2009. -比率の差の効果量計算の解説がある.


(3) 公式に必要な基本統計量を代入し,効果量を計算する.

p1 <-0.360 #  第1群(福岡市)の比率

p2 <-0.2842105 #  第2群(山口市)の比率

ES.h(p1, p2) # 公式 cohen's h = 2*asin(sqrt(p1)) - 2*asin(sqrt(p2))

#これらの値を,式に代入し,効果量Cohen's hを計算する.

 > library (pwr) # R内部に読み込む

# 効果量の計算式に代入

> p1 <-0.360 #  第1群の比率

> p2 <-0.2842105 #  第2群の比率

> ES.h(p1, p2)
[1] 0.1624483


(4) 結果

1. 比率の差p1-p2=0.08 の効果の大きさは,Cohen's h= 0.16である.

b. パッケージcompute.esの「propes関数」を使用した各種効果量計算

オッズ比(OR)をもとに各種効果量を換算し,信頼区間CI,p値も計算する.

OR<-(p1*(1-p2))/ (p2*(1-p1)),d <-(log(OR)*sqrt(3))/(pi) オッズ比からの換算式

(1) パッケージcompute.esのインストールとパッケージをRの内部に読込

・統計パッケージcompute.esをコンピュータに追加インストールする.

library (compute.es) # と記述し,パッケージをRの内部に読込.


(2) 比率の差の効果量の95%信頼区間や他指標の効果量を

 計算する関数 propes( ) の内容と使用法を確認するには,

help(propes) # と記述し効果量の計算のパラメータの解説が表示される.

> library (compute.es) # R内部に読み込む
> help(propes) 

propes関数の使用法
propes(p1, p2, n.ab, n.cd,level=95, cer=0.2, dig=3,
 verbose=TRUE, id=NULL, data=NULL)

基本統計量から次の変数をpropes関数に入力
p1 	第1群の比率 Proportion one.
p2 	第2群の比率 Proportion two.
n.ab 	第1群のサンプル数 Total sample size for group A and B.
n.cd 	第2群のサンプル数 Total sample size for group C and D.

propes関数で出力される効果量のリスト
注意「dはCohen's dではなく
Hedges'g 式(3.16)(3.17)p56 g.biased」*1
d	平均値の差の効果量 Standardized mean difference d. 
var.d	Variance of d.
l.d	下側95%信頼区間 lower confidence limits for d.
u.d	上側95%信頼区間 upper confidence limits for d.
注意「gはHedges'gでなく
バイアス補正したHedges'g 式(3.23) p59 g.unbiased」*1
g	平均値の差の効果量 Unbiased estimate of d. 
var.g	Variance of g.
l.g	下側95%信頼区間 lower confidence limits for g.
u.g	上側95%信頼区間 upper confidence limits for g.
r	相関係数 Correlation coefficient.
var.r	Variance of r.
l.r	下側95%信頼区間 lower confidence limits for r.
u.r	上側95%信頼区間 upper confidence limits for r.
p.r	p-value for r.
z	Fishers z (z').
var.z	Variance of z7.
l.z	下側95%信頼区間 lower confidence limits for z'.
u.z	上側95%信頼区間 upper confidence limits for z'.
p.z	p-value for z'.
OR Odds ratio.	オッズ比
l.or 	下側95%信頼区間 lower confidence limits for OR.
u.or 	上側95%信頼区間 upper confidence limits for OR.
p.or 	p-value for OR.
lOR Log odds ratio.	ログ・オッズ比
var.lor 	Variance of log odds ratio.
l.lor 	下側95%信頼区間 lower confidence limits for lOR.
u.lor 	上側95%信頼区間 upper confidence limits for lOR.
p.lor 	p-value for lOR
*1 "伝えるための心理統計 効果量・信頼区間・検定力", 大久保街亜(まちあ),岡田謙介,勁草書房,2012.

(3) 公式に必要な基本統計量を代入し,効果量を計算する.

p1 <-0.360 #  第1群(福岡市)の比率
p2 <-0.2842105 #  第2群(山口市)の比率
n.ab <-350 #  第1群のサンプル数
n.cd <-380 #  第2群のサンプル数
#これらの値を,式に代入し,効果量を計算する.
propes(p1, p2, n.ab, n.cd,level = 95, cer = 0.2, dig = 3, verbose = TRUE, id=NULL, data=NULL)

 > library (compute.es) # R内部に読み込む

# 効果量の計算式に代入
> p1 <-0.360 #  第1群の比率
> p2 <-0.2842105 #  第2群の比率
> n.ab <-350 #  第1群のサンプル数
> n.cd <-380 #  第2群のサンプル数
> propes(p1, p2, n.ab, n.cd,level=95, cer=0.2, dig=3, 
	verbose=TRUE, id=NULL, data=NULL)

Mean Differences ES: 平均値の差の効果量
 注意「dはCohen's dではなく
	Hedges'g 式(3.16)(3.17)p56 g.biased」*1
 d [ 95 %CI] = 0.192 [ 0.02 , 0.364 ] 
  var(d) = 0.008 
  p-value(d) = 0.029 
  U3(d) = 57.614 % 
  CLES(d) = 55.401 % 
  Cliff's Delta = 0.108 
 注意:パッケージcompute.esではHedges'gではなく
バイアス補正したHedges'gである. g.unbiased*1
 g [ 95 %CI] = 0.192 [ 0.02 , 0.364 ] 
  var(g) = 0.008 
  p-value(g) = 0.029 
  U3(g) = 57.606 % 
  CLES(g) = 55.395 % 
Correlation ES: 変数間の関係の大きさを示す効果量
 r [ 95 %CI] = 0.095 [ 0.023 , 0.167 ]  
  var(r) = 0.002 
  p-value(r) = 0.01 
 z [ 95 %CI] = 0.096 [ 0.023 , 0.169 ] 
  var(z) = 0.001 
  p-value(z) = 0.01 

 Odds Ratio ES: オッズ比の効果量 OR=(126/224)/(108/272)=1.417
  OR [ 95 %CI] = 1.417 [ 1.036 , 1.938 ] 
  p-value(OR) = 0.029  
 Log OR [ 95 %CI] = 0.348 [ 0.035 , 0.662 ] 
  var(lOR) = 0.025 
  p-value(Log OR) = 0.029 
   ・・・・・・・・・・・・・
*1 "伝えるための心理統計 効果量・信頼区間・検定力", 大久保街亜(まちあ),岡田謙介,勁草書房,2012.

(4) 結果

1. 比率の差p1-p2=0.08 の効果の大きさはHedges'g でg=0.19,95%信頼区間は[ 0.02 , 0.36 ]である.

2. 他の指標r=0.095,95%信頼区間は[ 0.02 , 0.17 ]である.

3. オッズ比 OR = 1.4 ,95%信頼区間は[ 1.036 , 1.938 ]である.

4. 結果と評価
  1. 比率の差p1-p2=0.08 の効果の大きさはCohen's h= 0.16である.

    Cohen's Effect Size "h"の効果の大きさの目安は0.20で効果量小であり,福岡・山口の都市間でHKTのコンサートに行く人の比率の実質的差はないといえる.

  2. 比率の差p1-p2=0.08 の効果の大きさはHedges'g でg=0.19,95%信頼区間は[ 0.02 , 0.36 ] である.

    Hedges'gのCohenの効果の大きさの目安は0.20で効果量小であり,福岡・山口の都市間でHKTのコンサートに行く人の比率の実質的差はないといえる.

  3. 他の指標r=0.095,福岡・山口の都市間でHKTのコンサートに行く人の比率の実質的差はないといえる.


    表 Cohenの効果の大きさの目安

    検定の種類 効果小small効果中medium効果大large
    2つの比率の差の検定 (カテゴリーデータ) h.20.50.80
    平均値の差の検定 d,g.20.50.80
    カイ二乗検定 (カテゴリーデータ) φ,w.10.30.50
    相関係数の検定 r.10.30.50

[ 効果量目次に戻る ]