MANOVAをしたときの効果量
なぜか一部の人はMANOVAを嫌うのだけど,MANOVAしたほうがいい場合っていっぱいあると思う。
で,ある統計の相談案件で効果量はどう報告したらいいのっていう話になった。
「そういやあまり聞かない」…というのは国内の外国語教育研究で概説が見当たらないっていうだけの話なんだけど,こういうのがMANOVAの普及を妨げているのかなと思ったり。査読者も単純に知らない場合がありそうだよね。
たとえば,前提がいいのかっていうと考えるのがメンドイのだけど,フィッシャーのあやめで考えよう。
フィッシャーのあやめは,3種類のあやめのデータが50ずつあって,4変数の連続データ(ガク片と花弁の長さと幅)。もうガク片と花弁がなにかとかよくわからないくらい自然からは離れた。
MANOVAで考えるのならば,4変数を従属変数として,あやめの種類が独立変数ね。
ほい。まずRでMANOVAしよう。
#データの構造を観る head(iris) #MANOVAのモデルを作る model<-manova(as.matrix(iris[,1:4])~iris[,5]) #モデルをみる model summary(model) #検定量がsummaryでいろいろ選べる #Royの最大根 summary(model,test="Roy") #WilksのΛ(ラムダ) summary(model,test="Wilks") #Pillaiのトレース(デフォルトがこれ) summary(model)
さて,多分もっとも使われているのは,多変量η自乗。
これはWilksのΛから計算できるらしい。
#modelからΛを得る lambda<-summary(model,test="Wilks")$stats[1,2] #式としては1-Λ^(1/s) #sを求める。sは水準数-1か,応答変数の数のうち少ないほうだそう。 #ここでは2 etasq<-1-lambda^(1/2) #はい出た! etasq
または,(今自分の中で熱い)マハラノビス距離を各種類間の組み合わせで考えてもいい。
これはまた今度にしよう。