草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

テトラコリック相関係数と文法性判断課題のデータ

最初に

ポリコリック相関係数は順序尺度(3件など)に「適応するとよいといわれる」相関係数の一種。

ポリシリアル相関係数は順序尺度と連続尺度。

テトラコリック相関係数はポリコリック相関係数の一種で,2値データによるもの。

これらは中に分布を仮定して順序尺度から推定する方法。

普通,無理矢理ピアソンの積率相関係数を用いるより値が大きくなるそう。

 

Rでは,polychoricとか,

polycorパッケージの,polychor関数やhetcor関数で簡単に求められる。

 

詳しくはググればいっぱい出てくるので割愛。

 

 文法性判断課題の話

さて。

二値的な判断による文法性判断課題のデータはもちろん0/1のデータ。

容認性判断課題の場合もせいぜいが(裏に連続性が仮定できる)順序尺度だろう。

文法性判断課題を行うタイプの第二言語習得研究者(私の分野は決して第二言語習得ではないけど)には,結構アナログな方が多いのでテスティングや統計のことにはあまり関知しない。

 

でも,例えば,文法性判断課題で出した項目のうち,この項目とこの項目の反応は類似すべきであるとか,これができたらこれもできるはずだとか,そういう情報が重要だということには異論がないだろう。

 

また妥当性の一種として,そういった構造的妥当性について考えないわけではないだろう。

 

例えば,今,たまたま手元にあるデータ。32人の大学生に対して48文の文法性判断課題を行った。文法文と非文法文が半分ずつ。文法文のスコアは論理的にもなにを測っているかわからないので,取り敢えず無視して,24項目,32人の0/1データを対象にする。ちなみにα係数は.83だった。

 

数量化III類でもいいんだけど,テトラコリック相関係数を用いて,行列を出して,それをとりあえず可視化するために,多次元尺度構成法をやる。

 

文法項目は,

  • 副詞の位置(adv)
  • 冠詞(art)
  • 助動詞(aux)
  • 埋め込み疑問(emb)
  • 仮定法(hyp)
  • 不定詞inf
  • 所有格(pos)
  • 3単現のs(tps)

それぞれにつき,3文ある。

えい!

f:id:kusanagik:20141016171627p:plain

やっぱり,人数が少ないのか,問題が悪いのか,いい感じに収束してない。100人はほしいところだな―。

ここで,IRT(項目反応理論)の2PM(2母数モデル)でも見て,悪い項目を落としちゃおう。Rのltmパッケージで。

 

えい。

f:id:kusanagik:20141016172012p:plain

あといろいろやって,適当に項目を殺していって…

まあこんな程度にはなるかな。

 

f:id:kusanagik:20141016172114p:plain

 やっぱり,項目60とかそれくらいやって予備実験やってとか,そういう感じだよな。この程度じゃダメだ。

 

ポリコリック相関係数を使うとカテゴリカル因子分析もできるし,構造方程式モデリングもできる。文法知識の一部を潜在変数として立てた上で回帰ができたら面白い。

 

例えば,中学校で習うbe動詞に関わる知識が現在完了形の知識とかそういうのにどういうようになっているのか,とか。そういう関係をモデル化したい。

例えば,時間制限を用いた条件と用いない条件でのモデルの比較とか。そういうのやりたいな。

 

 でも,もともとね,ポリコリック相関係数とかテトラコリック相関係数は後ろに連続的なものがあると仮定したものだからね,文法性なるものが果たして二値ではなくて程度をなすかとかそういう裏の話もあると思うんだけど。まあ,おいといて。

 

文法性判断課題の分析もこういう風になったらおもしろいな。