読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

「カタチ」で見る集団に対する処遇の結果

はじめに

集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。

データの可視化を…?

 

たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。

もちろん,こういうふうに可視化してもよい。

f:id:kusanagik:20150403154642p:plain

 

でもせっかく対応のあるデータなので,散布図にしちゃえばいいかもだ!

散布図はすっごい情報量がおおい。

f:id:kusanagik:20150403154903p:plain

便宜的に標準化しよう!

こういうふうに生の点数で可視化してもよいけど,

せっかくだから標準化しちゃえばいいかもだ!

 

ちょっと手間だけど,まずPreのデータを標準化する。

標準化っていうのは,

それぞれの点数を

 

点数-平均点/標準偏差

 

するってこと。こうすると平均点が0,標準偏差が1になる。

変換した得点をz得点とかよぶ。

 

Postの点数も同じようにしたい。

でも,ここはPreを基準に標準化しよう。

つまり,

 

点数-Preの平均点/Preの標準偏差

 

すると,Postのz得点の平均点が効果量⊿,標準偏差は,標準偏差の比率になる。これは分散比Fの平方根でもある。こういうことー。

 

f:id:kusanagik:20150403155321p:plain

データをこうして,細工するといろいろみやすいかもだ。

 

目で見る!

そんでもって,この標準化したデータの散布図を見てみよう,こいつはコトだ!

f:id:kusanagik:20150403155523p:plain

 

こんな感じになる。まんなかの斜線はy = xだから,これより下にいるひとは,点数がPostで下がっちゃったひと。全体的に左上にいるひとが多いといいかもだ。縦と横の破線はまんなかね。

この散布図では,縦の線も横の線もPreの平均点をあらわしている。なので,右上の象限にいるひとは,Preでは平均点よりも高くて,Postでは,それよりもいい点をとった。右下は,Preでは平均点よりもいい点をとったけど,PostではPreの平均点よりも悪い点をとっちゃった。左上は,Preでは平均点よりも下だったけど,Postではそれよりいい点をとった。左下はPreもPostも平均点よりも下。Postの平均点じゃないよ。Preの平均点。

 

さてさて,この散布図のカタチからさまざまな処遇の結果の特徴を把握したい。これでみる。

f:id:kusanagik:20150403160353p:plain

まずね。効果量は,Preの平均点(x = 0)における,Postの平均点。なので,相関楕円(ここでそれぞれのケースを大雑把にまとめて円で示していると思っていい)の中心の「位置」が効果量⊿。これが上にあればあるほど(統計的な意味での)効果があったということ。ちなみに,あたりまえだけど,この標準化したデータのときの切片は効果量といっしょ。

でも,効果だけが重要じゃない。楕円の縦の幅(というかその比率)は,処遇によって生じたばらつきを示す。縦長になればなるほど処遇によってばらつきが大きくなった。横長になればなるほどばらつきが小さくなったってこと。ばらつきが大きくなったなら,それはなにかのATIとかがあるかもだ。

 

楕円の大きさ(細さ・太さ)は共分散(とか相関係数)。相関係数が高ければ高いほど,PreとPostの関連が強いということ。それだけでなく,相関係数が高ければ高いほど(細いほど),一人一人の伸び幅のばらつきも小さい。相関係数が低ければ低いほど(太いほど,円に近いほど),伸び幅のばらつきが大きい。(つまり,差得点に基づく標準化平均差は小さくなる)また,楕円の向きが逆になったら,Preが出来る人ほどPostでは点数が低くなるってこと。(あるのかね?)

 

この変化を目で理解するにはこういう感じ。

f:id:kusanagik:20150403160916p:plain

左が効果量の変化,真ん中がばらつきの変化,右が共分散,相関係数の変化。

通常の効果量が表すのは,左の位置だけだから,散布図を描いてそのカタチを見ることが大事。もちろん,分散比(やその平方根)や共分散(や相関係数)を見てもいい。

論文では,事前―事後のデータでは,効果量だけじゃなくて,分散比や共分散を報告した方がいいとおもう。むしろ,分散共分散行列を報告したらいい。普通の量的研究は,MとSDを報告しているけど,共分散もほしい。

 

処遇の結果ハンコ

わたしなんか,散布図が好きなものだから,2変数の対応データときいたら,ハンコみたいなものだとおもう。イメージ的にはこんな感じ。

f:id:kusanagik:20150403161642p:plain

f:id:kusanagik:20150403162849p:plain

みたいな。なんて。