草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

因子分析は特定の観測変数の構成概念判定機ではないってこと(2)

前回のおさらい

さて,続き続き。

「観測変数の相関が高いってだけで,同じものを測っているとはいえない」という話でした。

構成概念妥当性観のことを言い出すと私は延々と止まらくなるので自重するけど,これは,観測変数の相関係数をもとめることが実質科学的に意味がないとかってことはない。または,業務上まったく役に立たないっていうことでもない。

逆に,自分が作ったある尺度が,何かの特定の観測変数と高い相関をもつだけで,尺度として,実務的には十分な場合もありえる。たとえば,TOEICテストと物凄く相関が高い(r = .96)自作の小テスト(K = 6)は,TOEICの代理指標として十分によさそうだ。TOEICにお金払わなくてもいいだけじゃなく,時間も運用も安上がりだ。

ただ,TOEICとその小テストが同じものの因果を受けているとは言い切れない,ってだけの話だ。そして,TOEICは英語の熟達度を測るテストだし,この小テストはTOEICとの相関が高いのだから同じ英語の熟達度を測っている,と簡単にみなすのにはちょっと慎重になろう,ってこと。

 

因子分析の話

心理学もまさにそうなのだけど,外国語教育研究が仮に科学だとしたら,東北弁でいうところの「やっけぇ科学」(soft science)なので,「目には見えないもの」についてあくまでも「人間が因果推論をしている」ってことを忘れちゃだめだ。

外国語教育研究者は,なぜか潜在変数のモデルに弱くて,あるモデルを無批判に,さもそれが真実であるかのように扱ってしまう傾向があると思う。あるモデルのフィットがよいと,それが世界の理かのようにイキイキと議論を始める。これに対しては,今は亡き前田啓朗先生の「落ち着いて考えようね」っていうひとことに尽きる。

たとえば実際の因子分析の因子は,ちょっとややこしい言い方だけど,「仮に見えない変数があったとして,それがうまく観測データにフィットする値を,観測変数から推定したもの」にすぎない。その「見えない変数が何か」であるかは,あくまでも研究者の内容に関する知識にもとづいて考察される。

たとえばこうだ。

TOEICと同じものを測るように作った3つのテスト(テスト1号~3号)と本物のTOEICを実施して,分析にかけたら,以下のようなモデルがよかったとする。

 

f:id:kusanagik:20160204192148p:plain

 

このとき,TOEICとテスト1号が高い因子負荷量を持つ潜在変数の解釈は,TOEICとテスト1号に共通的な因果関係を持っている(とすれば手元のデータがうまく説明できる)」なにかで,テスト2号と3号にかかる潜在変数も「テスト2号とテスト3号に共通的な因果関係を持っている(とすれば手元のデータがうまく説明できる)」なにかなんだ。

ここで,TOEICが測る潜在変数が英語の熟達度(?)だから,TOEICが因子負荷量をもつ潜在変数はすべて英語の熟達度だということはない。

因子なんて数式の上では手持ちのいくつかの観測変数に共通する成分にすぎない。普通,因果推論の方向性としては観測からはじまる。「観測変数に共通して影響を与えているなにか」は,観測変数の性質に対する人間の理解から得られる。観測変数の性質について不明のときには,このような推論をすることができない。たとえば上のモデルでは,テスト1号とTOEICに共通して因果をおよぼすだろうものを想像するのが正しい考えかただ。それを既知のTOEICの特性のみによって判断することはできない。

 

まとめ

さて。

このように相関分析や因子分析は,「この変数が何を測っているか」を教えてくれるオラクル・マシーン(神託機械)ではない。むしろ人間が普通に因果推論をするときに補助となる道具にすぎないし,主体は人間なんだ。外国語教育研究で多変量解析が一般化したのは20年ぐらい前の話で,歴史もすごく浅いし,未だに不理解も多い。ただ,その不理解が人間の普通の因果推論をさまたげ,そしてその不理解こそが使用者を惹きつけるものだったら,なかなかどうして…

いずれにせよ,「落ち着いて考えようね」ってはなしだ。