草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

【メモ】反映的モデル(reflective model)と形成的モデル(formative model)

観測変数と潜在変数の関係性についての話。博論関係のメモ。

基本的には関係変数と潜在変数の関係性は2種類に分けて理解できる。結果指標モデルないし反映的モデル(reflective model)と原因指標モデルないし形成的モデル(formativeモデル)。日本語訳としてすでに与えられているのは前者の訳だけど,おそらく外国語教育研究では,いまだに定着していないので,自分がわかりやすい反映的モデルと形成的モデルということばを使う。

反映的モデルとは,普通の因子分析のようなものだと理解できる。つまり,潜在変数は観測変数の値の原因となっているモデル。観測変数は潜在変数を「反映」している。強いいい方をすれば,潜在変数が観測変数の原因であり,観測変数は結果。誤差は観測変数について入る。

一方の形成的モデルはその逆。観測変数が潜在変数の原因となっている。観測変数が潜在変数を規定しているといえる。誤差は潜在変数に入る。潜在変数は潜在変数の共通する部分を示すのではなく,さまざまな観測変数の(重み付け)和のようなもの。主成分分析と似ている。潜在変数を観測変数で「形成」しているとも理解できる。

前者は心理学者や外国語教育研究者が関心があるようなものにあてはまる。後者の古典的な例としては,SES(Socio-Economic Status)。SESは,社会経済的な地位をあらわす構成概念であり,教育歴,収入,持ち家などの観測変数で測定される。しかし,潜在変数としてのSESはこうした観測変数の原因であるとはけっして考えられない。つまり,1単位SESが上がればその分に対応する収入が上がる,というような因果関係は簡単に考えられない。むしろ,その逆である。

もうちょっと具体的に比較すると,反映的モデルの観測変数間の級内相関は高いことが期待されるし,形成的モデルは観測変数間の級内相関にそのような期待をしなくてもよい。

具体的に分析上で形成的モデルを扱うには,場合によってはPLS-SEMを使う。PLSとは部分最小二乗法ないし偏最小自乗(partial least square)の略でSEMは構造方程式モデリング。なので,偏最小自乗構造方程式モデリングとか,偏最小自乗パス解析とか呼ぶのかな。PLS-regrressionというものもある。これは主成分分析+重回帰のようなもの,という説明がなされる。

Rでは,回帰分析用のplsパッケージというのがある。

PLS-SEM用には,plsSEMパッケージというのがある。