【FAQ】2×2のクロス集計への検定,標準回帰係数
最近受けた統計の質問。
カイ二乗じゃなくてG検定をやれ?
これはこの前行われたCELESの,私のワークショップのときに,ある先生からご質問頂いたのだけれども,ちょっと事例が個別すぎたので,その場ではお答えできなかったもの。こちらから連絡差し上げられないので,これ,読んでくださるかな…
Q:投稿した論文でカイ二乗検定をおこなったのだけど,査読者から対数をとった尤度比の検定(G検定)をやれといわれたので,困っている
A:くわしくやりとりできなかったので,おそらく2×2のクロス集計に対する独立性の検定などをおこなう,ということで,これもおそらくだけど,小標本だったり,0になるマスがあったり,ということで,そういう査読様のコメントだったのだと理解。一般的な話としては,フィッシャーの正確確率検定をおこなうとよいとおもいます。フィッシャーの正確確率検定は,
js-STAR 直接確率計算 2×2表(Fisher's exact test)
などでもできます。小標本の場合,これがよいと思います。
ただし,標本が十分に大きい場合は,カイ二乗検定もG検定も結果にそんなに差がないと思われます(前者が後者に近似している方法だから)ので,そうでしたら,そのように査読者に訴えるとよいとおもいます。ただ,一般にG検定のほうが好まれますし,フィッシャーの正確確率検定のほうが,より好まれるとおもいます。むしろ,独立性の検定の有意性自体はそんなに有益ではないと思います。有意性を確認した上で,各マスをみて,オッズ比とかも報告したらいいと思います。
標準回帰係数って相関係数とおなじですよね?
これはちょっと面白い質問。M1の後輩くんから。
一次の回帰直線の場合の回帰係数は,
y = a + bxとすると
b = r(sd[y]/sd[x])
で,さらに切片は,
a = mean[y] - b*mean[x]
なの。
回帰係数のbは相関係数と分散比(F)の積だということ。
両変数を標準化すると,両変数の分散(標準偏差も)は1になるので,
Fは1/1 = 1。
なので,標準回帰係数は相関係数と一緒。
y = ax + bの回帰式を作って,標準回帰係数を出してくれないからどうするんですか,っていう質問も昔あった。
ただし,これは回帰直線に限ったはなし。
昔,私はある査読様から,
「相関係数と回帰係数は同一であるから,回帰係数を報告するのは冗長である」という奇妙なコメントを頂いた。このとき,私は困り果て,「両係数の符号は一致しますが同値ではありません」と返した。でも,その査読様はきっと標準回帰係数のことだと思い違いされていたのだな,と最近気づいた。こちらの不見識で失礼したようなかんじもする。ただ,私は実測値スケールでの予測を考えて回帰係数と切片を報告したし,実際に値はまったく異なっていたのだけど…