草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

質的成果指標に関する後ろ向き研究:相対危険度とその信頼区間

ある質的な成果指標(ある試験の合格・不合格)がある。

テストが終わったあとに,合格した人と不合格だった人に,どの教科書(A,B)を使っていたかそれぞれ聞く。すると以下のようなクロス集計が得られる。

f:id:kusanagik:20160629110625p:plain

このとき,使用した教科書と合格・不合格の関係を知りたい。

これは疫学でやられる症例対照研究といっしょ。後ろ向き研究ともいう。後ろ向き研究は便利で簡単だけど,交絡因子の制御が大変だという。

つまり,よく見るこれと同じってことね。

f:id:kusanagik:20160629111020p:plain

症例対照研究では,これを相対危険度(RR)という指標で表す。

相対危険度は,この場合,喫煙してた人における疾病の割合(22/33=.67)と喫煙なしの人における疾病の割合(11/33=.33)の比率(.67/.33=2)を求める。この場合2なので,(交絡変数を無視すると)喫煙すると病気になりやすいとか,教科書Aを使うと合格しやすいとかいえそう。

相対危険度は,対数にしたりする。この場合は,0.69。

信頼区間も(正規分布への近似などによって)計算できる。

Rでやるなら,fmsvパッケージとかがある。

library(fmsv)
riskratio(22,11,33,33)

Disease Nondisease Total
Exposed 22 11 33
Nonexposed 11 22 33
Risk ratio estimate and its significance probability

data: 22 11 33 33
p-value = 0.007201
95 percent confidence interval:
1.166123 3.430169
sample estimates:
[1] 2

これでいいかな。

このパッケージにはオッズ比の関数もある。

oddsratio(22,11,11,22)

Disease Nondisease Total
Exposed 22 11 33
Nonexposed 11 22 33
Total 33 33 66

Odds ratio estimate and its significance probability

data: 22 11 11 22
p-value = 0.007201
95 percent confidence interval:
1.437257 11.132315
sample estimates:
[1] 4