草薙の研究ログ

英語の先生をやってます。

k層の2×2集計表メモ

勉強のメモ。メモしないと忘れちゃうもんな。

k層の2×2の分析をしなくちゃいけなくて,いろんな本を探したんだけど,これが一番よかった。

 

カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1)

カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1)

 

 

おもにコクラン・マンテル・ヘンツェル(CMH)検定というようなのを使う。コクランが入るのはもっと拡張された場合で,k層2-2だと,入らないのかな?

Rの関数にも用意されている。

wikiにも記事がある。

 

Cochran–Mantel–Haenszel statistics - Wikipedia, the free encyclopedia

コクラン・マンテル・ヘンツェルの統計量 - Wikipedia

 

こういう論文もあった。

Wittes, J., & Wallenstein, S. (1993). The power of the Mantel-Haenszel test. Biometrics 49, 1077–1087.

 

なんかBiometrics誌っていえば,この本を思い出す。カール・ピアソン,ゴセットとフィッシャーの関係とか。まあ面白い本だ。

 

統計学を拓いた異才たち(日経ビジネス人文庫)

統計学を拓いた異才たち(日経ビジネス人文庫)

 

 

さて。

可視化

まず,こういうデータを可視化するには,モザイクプロットをかいてみればよい。

めんどいからこれでいいや。

 

par(mfrow=c(2,3));for(i in 1:6){mosaicplot(dat[,,i],main=i)}

 

f:id:kusanagik:20150129152432p:plain

マンテル・ヘンツェル検定(藤井, 2010, p. 76)

で,マンテル・ヘッツェル検定。藤井先生はマンテル・ヘンセルとお書きのよう。

まあいいや。マンテル・ヘンツェル検定の帰無仮説は,k層それぞれで2つのカテゴリ関数の間に関連がない→オッズ比がそれぞれの層で1というもの。というよりはそれぞれ層を修正したχ2乗検定とかんがえるとわかりやすい。

マンテル・ヘンツェル検定の統計量はχ2。出力は統計量,自由度,p値,共通オッズ比とその信頼区間(マンテル・ヘンツェル推定量ともよぶ)。

 

mantelhean.test(dat)

で出る。

mantelhean.test(dat, exact=T)

で直接確率計算が代用できる。

 

オッズ比の等質性(藤井, 2010, p. 78)

それぞれの層におけるオッズ比の等質性を見るには,

epicalcパッケージのmhor関数というのを使うらしい。

 

mhor(mhtable=dat)

均一性の検定結果とそれぞれのオッズ比とその信頼区間を出してくれる。便利。この検定の帰無仮説は「それぞれの層でのオッズ比は等質である」。

 

もし違いがあったら,それぞれのオッズ比を可視化したらよいかも。

vcdパッケージのoddratio関数が便利だそう。

plot(oddsratio(dat,log=F))

これでどん。log=Fしないと対数オッズで出しちゃう。