草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

因子分析は特定の観測変数の構成概念判定機ではないってこと(1)

外国語教育の研究者の中には,「相関係数の値が高ければそれらふたつの変数は同じものを測っている(またはその度合いが高い)」っていう信念を強く持っているひとが多い。

そんなにひどい間違いではないと思うの。

でも,それは微妙にヒューリスティックがかかった見方かも。

厳密にいえばそうとは限らない。

ちょっと突っ込んで考えみたらいいかもだ。

 

最初にこういうモデルを考える。(面倒なので最初は誤差を考えない)

 

f:id:kusanagik:20160202223707p:plain

 

見えない潜在変数Xはふたつの観測変数における分散の(共通の)因果になっている。

読解力だとしたら,読解力が高い人は読解テストaとbで高い成績を取る,という因果関係がここにある。

潜在変数がもつ2つの観測変数に対する影響がともに「十分」強いとき,ふたつの観測変数がそれなりの相関を持つだろうって予想ができる。

ここから,逆説的に2つの観測変数の相関係数が高ければ,同じ潜在変数による因果を受けているだろう→同じ構成概念を測ると考えてもいいかもだ。

 

しかし,次のモデルではどうだろう。

 

f:id:kusanagik:20160202224927p:plain

 

ここで,2つの潜在変数の因子共分散が十分に大きく(潜在変数に強い相関があって),そしてそれぞれへの観測変数への影響もともに十分強いとしたら,たとえば,観測変数bと観測変数cの間にそれなりの相関係数があっても当然だ。でも同じ構成概念を測るとはいえない

 

または,こんな感じで誤差を考えて,それらに妙にいや感じな共分散があるモデルについて考えてみる。

 

f:id:kusanagik:20160202225605p:plain

 

このように,同じ潜在変数からの因果の影響がないとしても,たとえば観測変数bとcの間に強い相関があっても不思議でない。

大事なことは,「ふたつの観測変数の相関係数が高いという現象」の背後にも,さまざまなパターンがあるってことだ。

ふたつの観測変数の相関係数が高いってことだけで「同じ潜在変数の因果を受けている」→「同じ構成概念を測っている」と簡単に解釈することは勇み足でしかない。

 

また,構成概念Xを測っていることが既知である観測変数aと,構成概念Xを測っているか不明な観測変数のbの相関係数を観測し,それが低ければ構成概念Xとしての観測変数bは妥当でなく,高ければ妥当である,というような妥当化にも,ちょっと慎重でなければならないと思う。

まず,第一に目的として,もう疑わなくてもよいレベルで構成概念Xを測っていることが既知である観測変数aがあり,そしてそれを真として扱うのならば,別の変数の妥当性をいまさら検討する意義はちょっとわからない。分かってるのを使えばいい。

次に,「もう疑わなくてもよいレベルで構成概念Xを測っていることが既知である観測変数aがある」ようなことは殆どない。

簡単にいえば,「観測変数aについてはなぜ疑わなくても良いのか?」ということだ。

(続く)