草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

どう見ても違うものを同じという怖さ

どう見ても違う

直球でいこう。こういうこと。

てい!

f:id:kusanagik:20150614213841p:plain

効果量の値は同じ!でもどうみてもぜんぜん違う!

 

情報の集約あれこれ雑感

最近よく,

f:id:kusanagik:20150614214450p:plain

みたいな表を見るようになった。*1

 

情報の集約として,別に悪いとは思わない。*2

集約の程度が大きい,ということは統計分析上の悪いことではない。

むしろ適切なレベルでの集約が統計分析の要諦。

でも,俺みたいな未熟者はこのとき,d = 0.8とd = 14は同じ「大」じゃねえよなあ…と思い,論文を書いたりするときは,上の図のふたつを同じ数値であらわすのはなんだかなあ,って思う。

なんだっけ,この感覚,ああそうだ。「彼女どんなひと?」とあまり仲良くないひとに聞かれたときに似ているんだ。一言で表せるような思い方をしていない。「かわいい」とか「きれい」とか,お世辞やアイドルについてヘラヘラとよく考えもせずに使うようなことばでは,「違うものを同じ」というような気がして気が引ける。

それと同じ。数値ひとつで2変数について知っていることを全部表せるわけではない。ここでなんか思い切りがつけられない。よし!いくぞ!って思い切りをつけてもいい。そこでd = .50と書くとする。…それが結局「中」とか「大」とかになるんだ。すごいよな。彼女とのことをいろいろ思いを巡らせ,たった一つの形容詞にできないと思って,でも,って思い切って何かをいったら,「彼女は女」みたいなもんだよなぁ。

 

なんかあれだよなあ。情報の集約っていう意味だったら,かの悪名高い,

 

f:id:kusanagik:20150614220158p:plain

 

これも,効果量もある意味似たようなもんだよなあ。

効果量は「なし」「小」「中」「大」っていうとする。

スターカウンティング分析(??)は,「ns」「*」「**」「†」

の4つだ。ほら,情報量はまったく一緒だ。

 

結局,聞き手と読み手がどういう集約のレベルでほしいか,っていうのがいつでも情報化時代の黄金率だよな。

 

…なんだか,息が詰まるな。ラーメン食いたい。

(久しぶりの雑感風…このわかるようなわからないような感じが「あられやこんこん」時代みたいだ)

*1:項目4が2つあるとかそういうのはどうでもいい。

*2:測定誤差とか信頼区間とか度外視でいいね