草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

気軽に「説明」とはもういわない

説明

あいも変わらず,不勉強ゆえに,よく考えずに軽々しく,説明などという難しいことばを何度も使ってきたものだが(幸いなことにあまり自分の論文や原稿には使用例が見当たらなかったが),他人の使用はどうであれ,私はこの説明ということばを軽々しく使わないことを,死んだ愛犬のジョンに誓った。私が知る限り,少なくともこのことばは,かなりの頻度をもって,健全なコミュニケーションを妨げる。

演繹のこと

説明の科学的定義ともいったりするらしい。一般法則から個別の事象を導くことなど。これは,もっとひろく論理学的にいえば演繹のことだ。

妥当な推論であるところの「A(条件,または仮定)ならばB(帰結,または結論)である」とAが真であるということから,Bが真であると導くわけだ。

人間の会話を例にすると,「どうしてご飯を食べたの?」という疑問に対して,「だってお腹が空いていたんだ」と答えるのは,質問者と回答者の中で,「お腹が空いていれば(条件),ご飯を食べる(帰結)」を妥当な推論として先んじて共有した上で,回答者しか知らぬ条件「お腹が空いている(いた)」が真であることを回答者に知らせ,演繹によってすでに得られた帰結を再確認することだ。

つまり,議論に先んじて得られた帰結と,未だ共有されていない条件の下で,条件を伝え,帰結が演繹によって再確認できることを示す。

 

心理的帰結のこと

説明の心理学的定義ともいったりするらしい。この定義において説明とは,帰結主義的に,人間の主観および内観において,納得した,理解したという心的状態をもたらすこと,といった具合だ。たとえば,数理モデルで完璧な予測と制御ができる状態でも,それは説明したとはいわないというひともいるし,数式を読む人にとっては数式によって心理学的に納得したと感じるかもしれないし,自然言語でなにかのメタファーを使わなければ納得したと感じないひともいる。大概の場合,なんらかのメタファーと後述するアブダクションによって,納得したと感じるひとが多い。ある研究について,頻繁に「直観に合う」とか「面白い」とか「興味深い」という形容をされる研究者にとって,大概説明とはこの心理的帰結のことだ。草薙がこういうタイプの研究者を悪くいっている,と皺を寄せる方もいるかもしれないが,ここのいい方に他意はない。ただ,そういう方もいる,という記述を与えているだけだ。

 

アブダクションのこと

パースのアブダクションを論理のひとつとして認めるひともいるし,すくなくともこれが文字通り仮説形成という役割で,我々の研究においてものすごく重要であることは誰も疑わないと思う。しかし,くだらないかもしれないが,もちろん,アブダクションは演繹ではない。

アブダクションは,所与の帰結Bと,A→Bを妥当な推論とみなすことによってAについて推論することだ。もちろん,これはA⇔Bでなければ正しいという保証がない。ご飯を食べたという帰結と,「お腹が空いているとご飯を食べる」が妥当な論理であるとしたうえで,「お腹が空いていたのだろう」と推論することだ。

アブダクションがだめとはいわないが,これは演繹による確認という意味の説明ではないアブダクションは,数理モデリングではとてつもなく重要で,尤度とかベイズ推定という根幹をなす考え方なんだけど,もっともらしいということを説明とはいわない。

心(mind)一般について私が受け入れない理由はこれだ。私は一般に,(専門用語としての)心は行動からアブダクションされたものだと考えている。たとえば,英会話場面における発話数が少ないという帰結と,スピーキング不安が高ければ,英会話場面における発話数が少ないという(どこから来たかわからない)デカルト的な論理によって,(心としての)スピーキング不安が高いという条件をアブダクションしている。これは少なくとも演繹的な説明の科学的定義に沿うものではない。仮説形成であるとしても,心が見えないばっかりに,このアブダクションされた仮定や条件を直接的に調べる方法はありえない。

予測と統御

最近では,実データの予測と統御がある社会的文脈と歴史の上である程度可能であるという事実を説明と呼ぶという態度も見られる。私自身は,心理的帰結を説明に積極的に含めるならば,別にこれを説明とみなすこともまったくやぶさかではない考えなのだが,コミュニケーションを妨げるひとつ原因であると感じるようになった。*1

で,どうするか

演繹の場合は演繹,アブダクションの場合はアブダクション,予測と制御,そして心理学的帰結をそれぞれいいわける必要があると痛感している。以下のような使い方をする。

  • 結果は,論理Xと仮定Yによって演繹的に導かれる
  • この言明は,あるひとにとって,心理学的帰結としての説明をもたらす可能性がある(または,広くいってこの言明は効用をもたらす可能性がある)
  • 本論文は,観測されたXと論理YによってZという仮説を立てた
  • この数理モデルから得られる予測値は,観測データの優れた近似になった

ここまでのまとめ

これまでの「もういわない」は以下の通り。

  • 測定する
  • 客観的
  • 説明

…なので必然的に私は,これからの研究実践において,「客観的な方法でなにかを測定して,事象やその背景にあるメカニズムを説明する」ことはない。

 

 

*1:モデリングという考えについて話すときに,毎回「それは説明ではない」とか「それは予測ができるだけで意味がない」というコメントをいただく。何度も,ほぼ必ずといっていいほどこういったお叱りを受けるので,対応テンプレートを用意した。まず,前もって,説明とはいわないことだ。大概は,モデリングによる予測と制御によって,個人および集団の効用を高めることを目標とするといっておけばよい。事実まったくそのように考えているし,個人の心理的帰結としての説明を受け入れるならば,これを説明といわない境界線について考え始めなければならなくなるから。次に,予測ができないが納得する説明と,先生はなぜか納得はされないが完全な予測ができる説明では,どちらが経済学的な意味での成果になりますか?と聞き返すことだ。最後に,先生がおっしゃる説明や意味とはなんですか?と聞き返すことだ。大概これで嫌な顔をされるが会話は終わる

RでABAB計画のグラフ

応用行動分析(ABA)とかで行われるABABデザイン(外国語教育研究では単一事例分析として知られる)の結果について可視化するグラフを描く必要がある。行動系の論文でよくみるこんなやつ。

f:id:kusanagik:20180816175702p:plain


えっと,ここではABAB計画(baseline - treatment - baseline - treatment)で,反応回数を均等に5セッションずつ記録したとしよう。なので全20セッションとする。
これだとこんなふうに描くといいかな。

#データ例
a1<-c(2,1,4,2,3)
b1<-c(7,8,8,7,8)
a2<-c(2,1,3,2,3)
b2<-c(8,7,6,7,5)

#作図例
plot(1:5,
	a1,
	type="b",
	xlim=c(1,20),
	ylim=c(0,10),
	cex=2,
	pch=20,
	xlab="Sessions",
	ylab="Number of Responses",
	axis=F)
axis(1,1:20)
lines(6:10,b1,type="b",cex=2,pch=20)
lines(11:15,a1,type="b",cex=2,pch=20)
lines(16:20,b2,type="b",cex=2,pch=20)
abline(v=c(5,10,15)+.5,lty=2)
text(3,10,"Baseline",cex=1.2)
text(8,10,"Treatment",cex=1.2)
text(13,10,"Baseline",cex=1.2)
text(18,10,"Treatment",cex=1.2)


よし。

「客観的」とはもういわない

客観的ということばのあいまいさ

これまた不勉強故で「客観的」ということばを使ってしまっていたのだけど(幸い自分の論文を探したらあまり出てくることがなかったが),少なくとも外国語教育研究では,このことばは非常にあいまいであり効率的なコミュニケーションを著しく妨げるので私は個人的にもう使わないことにした。このことばは以下のように文脈に依存して使い分けられている。もはや手法としてsoundだとか,そういった意味でしかない。それに否定をともなってよく使用される語だ。客観的でない,など。

観察できるひとの数(私的事象と公的事象)

私的事象とはそれを観察するひとがひとりである事象だ。公的事象はふたり以上だ。客観的というとき,公的事象を示す場合が多い。主に(私的事象である)内省は客観的でない,などといわれる。少なくとも私の研究では,私的事象も公的事象も関心の中にあるため,これらを区別するためには,もっとも一般的で明確な私的事象と公的事象という用語のみを使うことにした。スキナーがいうように,私も「境界線としての肌はそれほど重要だとは思わない」

支持するひとの数

ときに,ある理論や仮説,または方法論や手続きを支持する人が相対的に多い場合に,客観的だという方がいる。「先行研究がたくさんある客観的な方法です」という状況だ。私は,単純に支持するひとが相対的に多い,ということにした。

データの尺度水準

カテゴリカルデータよりも順序データが,順序データよりも連続データが客観的だという方がいる。これは非常に馬鹿げている自然数よりも整数が客観的だとか,整数よりも実数が客観的だとか,それらが馬鹿げていると思うのとなにも変わらない。

信頼性係数等の高さ

クロンバックのα係数が高ければ客観的だとか,低ければ客観的な測定ができていないという論旨を聞くことがある。または評定の一致度なども。これも信頼性係数が高い値を示した,一致係数が高い値を示したということにした。

量的研究と質的研究

量的研究は客観的であって,質的研究は客観的でない,というようなトートロジカルにそれぞれの研究法に添えられる用語としてのためだけに客観的とはいわないことにした。ただのトートロジーであってそれ以上の意味がない場合が多い。

研究者の自由度

研究者が分析やデータを処理する過程において,研究者の避けがたい判断が多ければ,客観的でない,または判断がなければ客観的である,というようないい方はしないことにした。単純に研究者の自由度を問題にしたらよい。たとえば,因子分析モデルは,因子数や回転方法や推定方法などを決めなければならないから客観的でない,みたいな用法だ。

属人性一般

これ以外にも,もはや,客観的とは,属人性,つまりひとに属する要素がない程度といった意味でどんなときにも使われている。普通に属人性ということにした。

(観測変数Aが構成概念Bを)「測定する」とはもういわない

他人の使用がどうであるかはとりあえず置いておいて,私は,「観測変数Aが構成概念Bを測定する」("A measures B")やそれに類する表現("what A measures is B")を二度と使わないと田舎のボケたおばあちゃんに誓った。昔,あまりよく考えずに使ってしまっていたことがあったけど,他所の分野はどうであれ,外国語教育研究に関する限り,これが大変に曖昧な表現であり,そして効率的な学術コミュニケーションを著しく妨げるので,いっそのことまったく使わないことにした。過去の自分の不勉強を悔いてもいる。

なので,

  • 読解テストAは読解力を測定する
  • 文法性判断課題は文法知識を測定する
  • 不安尺度は不安を測定する

などとはもういわない。あまりにも曖昧な表現だ。

潜在変数モデルの測定方程式

かつて,私がこういう表現を使ったときは,もっぱら,自分では,ある潜在変数モデル上における測定方程式のことを示しているつもりであった。たとえば,ひとつの潜在変数と3つの観測変数についての一因子モデルを念頭に置くと,観測変数x1, x2, x3が構成概念(または潜在変数)y1を測定するとは,「観測変数x1, x2, x3は潜在変数y1を項にもつ関数である」といった意味のつもりだった。しかしよくよく外国語教育研究を見てみると,この意味の他にさまざまな解釈が与えられていることがわかった。これでは紛らわしいので,潜在変数モデルの測定方程式を示す場合は,ちゃんと数式やモデル式を書くか,

  • モデル上において,観測変数xを,潜在変数yを項にもつ関数としてみなす
  • モデル上において,観測変数xは,潜在変数yから回帰されていると仮定する

という。厳密にいえばすべてのモデルは虚構(fiction)なので。

操作的定義

外国語教育研究における「観測変数Aが構成概念Bを測定する」は,潜在変数モデルを一切含意しない,単純に操作的定義を示しているという例もある。たとえば,クラクションの長さは運転者の怒りを示している,といったことだ。この意味で述べるときは,そのまま,

  • 観測XをYの操作的定義とする

か,もっと自分好みなのは,あくまでも目的に応じた人間の行為であることを強調して,

  • 本研究は,測定された観測XをYの操作的定義としてみなす
  • 本研究は,測定された観測XをYに対応付ける

という。

未検証であるところの測定対象・測定ドメインの抽象的な参照

外国語教育研究では,この例がもっとも多い。読解テストは読解力を測定する,といったように,測定の対象とする構成概念と観測への対応を参照する場合に使うことだ。ポイントは,潜在変数モデルや操作的定義とは関係なく使われるということだ。妥当性についての検証が不明な,または未検証な尺度やテストなどが主張する測定対象を示すといった場合だ。こういうときは,

  • 観測Xの測定対象は構成概念Yであると主張されている
  • 観測Xの測定対象は構成概念Yであるとみなされている
  • その測定対象が構成概念Yであるとされる観測X

などという。主張されている,みなされている点が事実であれば少なくとも嘘にはならない。その面で誠実な表現だ。受け身形を使うときは,その主体を引用するとよいかもしれない。

  • 観測Xの測定対象は構成概念Yであると主張されている(e.g., Jones, 2014, 2015)

のように。

観測変数x1と高い相関を示す別の観測変数x2があり,ある構成概念yの操作的定義とされた観測変数がそのx2であったときのx1とyの関係

なんだかややこしい。こういう書き方をするとブログの閲覧数は減る。しかし,こういう場合だ。文法テストがあるとする。この文法テストは,構成概念であるところの文法知識に対して,操作主義的に対応付けられている。そこで,この文法テストと相関(r = .80)を示した新テストがあるとする。不思議なことに,この新テストは文法知識を測るとされる。別に相関に基づく妥当性を全否定するわけじゃないけど,これと上記のものは異なることばで表されるべきだと思う。いうとしたら,

  • 観測変数x1と構成概念yの操作的定義であるとみなされた観測変数x2には相関がある

「測定する」自体は?

肝心の測定する,測る自体は,私は観測を得るという意味でしか使わないことにした。それも気がひけるので,どちらかというと観測を得る,observeを使う。手続きや変数の単位がそれほど明確でない場合も使えるし、観測するは測定も含む。

 

頭の中に追い込むときっとそれはどこかへ逃げていく

よくある話

  • 「私の学生たちには,話すことに対する不安があるため,英語を話す課題を与えても一向に英語を話さない」
  • 「私の学生たちは,動機づけの程度が低いため,英語を話す課題を与えても一向に英語を話さない」
  • 「私の学生たちは,やる気がないため,英語を話す課題を与えても一向に英語を話さない」

などといった旨の言明は,職員室や飲み会における英語教師同士の会話によく出てくるだけでなく,英語教育に関する学会にでもいけば,一日に3個は用例を見いだせるような,そんなありきたりのものだ。

こういった言明の理屈

このような言い方自体が悪いのだ,という含意はまったくないが,これらには考えるべき点がいくつも含まれている,というのも事実だ。

1つ目は,if then形式の命題(if-then proposition)与件として与えられているように読める点だ。以下のような命題が前提にされている言明に読める。

  • (if)もしも話すことに不安がある場合,(then)英語を話す課題を与えても一向に英語を話さない
  • (if)もしも動機づけの程度が低い場合,(then)英語を話す課題を与えても一向に英語を話さない
  • (if)もしもやる気がない場合,(then)英語を話す課題を与えても一向に英語を話さない

当たり前のように,つまり与件のようにいわれているが,これらの命題自体は一向に未検証なままの場合もあるし,合理的に与件とされて検証する必要がないとされるか,または心理学といった他分野の先行研究に基礎付けされているのだぞ!と主張されることもある。まあ,場合によるけど,正直いって結構あやしいもんだ。主観を表しているにすぎないときもある。

とにかく,このif-then propositionに対して,「私の学生は不安がある」「私の学生は動機づけの程度が低い」「私の学生はやる気がない」といった命題を付け足して,演繹的に,「私の学生は英語を話さない」を導いているというわけだ。

私の学生は不安がある → 不安があると一般的に人は話さない → だから私の学生は話さない。なるほどな,と。

…ん,そうなのか?演繹なのか?

私たち教師は,一向に英語を話さない様子を一種の行動として観察している。ある程度手順を工夫して定めれば,英語を話さない様子も記録することができるだろう。

一方,不安がある,動機づけの程度が低い,やる気がないはどうだろう?不安,動機づけ,やる気は一般に心理的特性だと考えられていて,直接的な観察はなされない。むしろ,構成概念として扱われ,モデル上では潜在変数という数学的抽象物になる。少なくとも潜在変数モデル上では,この潜在変数の値は,さまざまな観察可能な行動,たとえば発話確率,または質問紙の各項目における反応に対する原因となっている。

しかし,改めて,このような潜在変数として不安,動機づけ,やる気は日頃の教育実践のなかで直接的に観察できるものではない

非常にややこしい。どうも遠回りのように思える。

直接的に観察したはずの「私の学生は一向に英語を話さない」を導くために,直接的に観察していない「私の学生は不安が高い」という命題を仮定する,とは。

遠回りというか,余計にも見える。なんのために中間的な命題(しかも怪しい)を(さも与件のように)用意したのだろう?私の学生は一向に話さないじゃだめ?なぜそこに理由付けをしたのだろう?

ううむ。

いやいや,その前に,論理が逆だからだ,というひともいるだろう。たとえば,哲学者のライルや一種の行動主義者にとって,心理特性や能力は,顕在的な行動の(認識的,言語的)カテゴリーであって,一向に英語を話さないという顕在的な行動とその他の行動が属するカテゴリーが,不安,動機づけ,やる気と一般に呼ばれているのだ,みたいな。すなわち,「私の学生が一向に英語を話さない」ということから,逆に不安がある,動機づけの程度が低い,やる気がないを類推していると。なので,もしもいうとしたら,

  • 「私の学生たちは,英語を話す課題を与えても一向に英語を話さないので,話すことに対する不安をもっているかもしれない
  • 「私の学生たちは英語を話す課題を与えても一向に英語を話さないので,動機づけの程度が低いかもしれない
  • 「私の学生たちは英語を話す課題を与えても一向に英語を話さないので,やる気がないのかもしれない

私もふくめて,これらのような言い方が自然だと感じるタイプのひともいる。一貫してこのようにお話す先生もいらっしゃるように感じる。

効果検証における成果変数となるべきなのは?

そこで問題となるのが,なにかの処遇の効果を検証するための成果変数はどちらの種類であるべきか?ということだ。一向に話さないという行動,沈黙行動としよう,それを「発話確率」として測定し,これを成果変数とするべきなのか?それともスピーキング不安や動機づけの質問紙を使って,その因子得点を成果とするべきなのか?これも考え方による。しかし,外国語教育研究における多数の研究者は,後者の方を成果変数としている。外国語教育研究では,「不安を低減させる教育実践」「動機づけを高める教材」そして民間企業等では「やる気を出させる秘密の方法」などといった表現がいっぱいだ。

非常に面白いことだ。ここで,こんな例を考えてみよう。沈黙行動は「不安」という心理の結果だと考えるように,喫煙行動は,「たばこの吸いたさ」といった心理の結果だと考えることとしよう。この考え方に基づいて,実験をする。ニコチンパッチを貼るグループと貼らないグループにそれぞれひとを割り当てて,事前事後で「たばこの吸いたさ尺度」の合計点を比較する,みたいな。それで,めでたいことに「たばこの吸いたさ尺度」の合計点は貼るグループの方が低くなったぞ!と。で,私は疑う。禁煙はできたのか?タバコは吸わないようになったのか?一方,まったく疑わないのは,質問紙で「たばこを吸いたい」というような反応は下がっている,ということだ。

ここでの問題は,「たばこの吸いたさ尺度」の得点と喫煙行動の間にある相関関係だ。もしもこれが非常に高く,そして喫煙行動を観測するよりもこの質問紙調査や問診をするほうがコストがかからないのであれば,まったく問わない。しかし,どうだろう?アンケートでたばこは吸いたくありませんというような回答をするからといって,実際に喫煙行動をするかどうかの関係性を,非常に高いと見積るひとはいるだろうか。むしろ喫煙者の自分はいつも,「俺は吸いたくないのに喫煙がやめられない」と思うし,世の禁煙セラピーとか禁煙外来もそのような態度のようだ。「やめたいのにやめられない」という広告でいっぱいだ。

さて,スピーキング不安尺度と沈黙行動の関係はどうだろう?同じように,この関係も強いとはいえないだろう。むしろ逆に,「外国語学習に関する心理尺度の得点とその帰結に関すると見込まれている行動の相関関係は,一般のひとや研究者が期待するよりずっと低い」というのが現状だろう。コミュニケーション意欲が高ければ発話数が多い,といった研究も数多くあるが,無相関検定の有意性を報告している程度のことだ。

それと,ある行動の背景には複数の心理的特性があり,複雑な関数関係がある,というのはよく聞く言い分だ。まったくそのとおりだと思う。同じ行動の背景に,不安,動機づけ,やる気…などを見出すくらいなのだから,まさにそうだ。それだけにとどまらず,状況,場面,文脈,時間,そういった種々の要因も無視できない。

それだったら,一向に話さない程度,沈黙行動,または発話確率を直接的に成果変数としたほうがよい。単純で顕在的な行動の方が,心理的特性よりも誤差が少なく扱えるだろうし,複数の研究によって成果を統合するためには変数自体とその測定モデルが揃わなければならないが,これらのいわゆる測定の多様性問題を回避できる。すなわち,より社会的な帰結につながるだろう行動,それもそこに合意が得られやすい行動を成果変数とした方がよいわけだ。

ただし,ある行動が起きて,またはある課題の成績がよいからといって,(関連を見込まれる)他の行動や他課題の成績と連関するとは限らない,そのような複数の行動の背景に潜在変数を考えることは当たり前だ。ただし,その潜在変数が質問紙の得点によって測られているものと相関するかはまた別の問題だ。

目的依存性・帰結・コスト

顕在的な行動の方を成果変数とした方がよい,といってもそれは,教育実践の向上のために,ある処遇の成果を検証する,という目的の場合だ。どんな研究であっても,少なくとも応用分野であれば,目的に依存する。外国語教育研究のような応用分野では,微視的な心理的カニズムというよりも,巨視的な意味での帰結が重要であるから,個人および社会の効用に直結する帰結にあたる顕在的な行動を対象とするほうが,往々にして都合がいいときがある,というだけの話だ。そしてそれもコストによる経済的な側面からも評価される。ある行動を観察するよりも質問紙の方がはるかに安いという場合もないとはいえない。

しかし,ここで私がいいたいのは,我々は必ずしも心理学者にならなければならないというわけではない,ということだ。逆にいうと,心理や認知に帰着せずとも教育実践は向上させられる可能性がある,ということ。餅は餅屋だ。心理学者の真似を苦しくもしながら微視的な心理メカニズムを解明する,または認知機構を明らかにする,そのような目的を常に高らかと掲げる必要もない。そういったスタンスを取れば,科研が通りやすい,論文を載せやすいということはもしかしたらあるかもしれない。しかし,我々教師が業務上で見ること,感じること,実際にやること,そしてやらなければならないことを,なんでもかんでも判を押したように頭の中に追い込むと,ミイラ取りがミイラになるかもしれないし,その間に我々が本当に知りたいことの答え,解決したい問題の解決策はどこかへ逃げていくんじゃないかと思う。

 

 

RでKendall距離,Hamming距離,Cayley距離,Ulam距離

順序間の距離を表す,(編集型の)上記の距離をRでもとめる。PerMallowsパッケージというのを使う。

library(PerMallows)
x<-c(1,2,3,4,5,6,7,8,9,10)
y<-c(2,1,3,4,6,5,7,9,8,10)
distance(x,y,"Kendall")
distance(x,y,"Hamming")
distance(x,y,"Cayley")
distance(x,y,"Ulam")