読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

MANOVAをしたときの効果量

r 教育 統計

なぜか一部の人はMANOVAを嫌うのだけど,MANOVAしたほうがいい場合っていっぱいあると思う。
で,ある統計の相談案件で効果量はどう報告したらいいのっていう話になった。

「そういやあまり聞かない」…というのは国内の外国語教育研究で概説が見当たらないっていうだけの話なんだけど,こういうのがMANOVAの普及を妨げているのかなと思ったり。査読者も単純に知らない場合がありそうだよね。

たとえば,前提がいいのかっていうと考えるのがメンドイのだけど,フィッシャーのあやめで考えよう。
フィッシャーのあやめは,3種類のあやめのデータが50ずつあって,4変数の連続データ(ガク片と花弁の長さと幅)。もうガク片と花弁がなにかとかよくわからないくらい自然からは離れた。

MANOVAで考えるのならば,4変数を従属変数として,あやめの種類が独立変数ね。

ほい。まずRでMANOVAしよう。

#データの構造を観る
head(iris)

#MANOVAのモデルを作る
model<-manova(as.matrix(iris[,1:4])~iris[,5])

#モデルをみる
model
summary(model)

#検定量がsummaryでいろいろ選べる
#Royの最大根
summary(model,test="Roy")

#WilksのΛ(ラムダ)
summary(model,test="Wilks")

#Pillaiのトレース(デフォルトがこれ)
summary(model)

さて,多分もっとも使われているのは,多変量η自乗。
これはWilksのΛから計算できるらしい。

#modelからΛを得る
lambda<-summary(model,test="Wilks")$stats[1,2]

#式としては1-Λ^(1/s)
#sを求める。sは水準数-1か,応答変数の数のうち少ないほうだそう。
#ここでは2

etasq<-1-lambda^(1/2)

#はい出た!
etasq

または,(今自分の中で熱い)マハラノビス距離を各種類間の組み合わせで考えてもいい。
これはまた今度にしよう。