草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

学習時間の和もガンマ分布って話とか

学習時間(もとい,ICT教材などへのログイン時間)は往々にしてガンマ分布やワイブル分布やその他の親族の分布に従う。もう,これは外国語教育研究の定番でいいんじゃないかと。

まあ,記述的には最尤推定して形状母数や尺度母数と対数尤度,AICBICなどを報告してカーネルとかといっしょに絵でも描けばいいんじゃないかっていう。

で,当たり前なんだけど,ガンマ分布に従う変数同士の和の分布もガンマ分布に従うんだよね。これはありがたい。よく教科書で見る「分布の再現性」ってやつね。結構実務的に意味がある。

たとえば,ある教材AとBの関係はものすごく強くて,一緒にまとめてしまえってとき,この和がまたガンマ分布に従う。これは便利だ。尺度母数が一緒で,それぞれ形状母数がK1, K2のガンマ分布に従う変数の分布の形状母数はK1 + K2。これはすごい。

まじかな。

r1<-rgamma(1000,2,1)

par(mfrow=c(2,2))

hist(r1)

r2<-rgamma(1000,10,1)

hist(r2)

hist(r1+r2)

r3<-rgamma(1000,12,1)

hist(r3)


うお。まじだ。


f:id:kusanagik:20160530190720p:plain