読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

モデルの中で何が捨象できるかを語らない科学

数理モデルというものは,その記述の仕方の形式性の割には,数理モデルということばに親しみを感じないほとんどのひとが思うより,本来結果主義的で効用主義的なものだ。 モデルは,もちろん現象それ自体ではないし,その現象を大幅に捨象していて,しかしそ…

Rで日付データの処理

自分用のメモ。 #日付クラスへ変換 d<-"2016-1-1" d2<-as.Date(d) class(d2) #日付データの足し引き(日付クラスだとこれができるようになるのが最高) d2-1 d2+1 d2-1000 d2+1000 #基準日から1日毎にログイン回数を累積計算 #datは時間とログイン回数のデー…

非線形最小二乗法で学習コンテンツ消化曲線をモデル化

まあ結構いろんなことに汎用的に当てはまることだと思うのだけど,ソフトウェアの品質管理とかの分野では,ソフトウェア信頼度成長曲線という手法があるそうだ(古い友人に教えてもらった)。これは,ソフトウェア開発において,バグの発見数や残ったバグの…

最尤推定した母数のもとでの確率密度曲線をヒストグラムに描き足す

えっと,リクエストがあったのでここに書く。(SPSSならそれっぽい曲線もつけてくれるのにRはそんなこともできないのか?といわれた)まずはこんなデータがあるとしよう。形状母数が3,尺度母数1のガンマ分布にしたがう300個。 set.seed(0) dat<-rgamma(300,…

野良観測変数?

なんていうんだろ,それが何を測るかは一切分かっていないけど,その変数の利活用を暗に強いられているような変数。 オンライン学習履歴データとかがまさにそうだ。オンライン教材のログイン時間とか。これは何か測定を目指す構成概念がこのデータに先んじて…

オンラインでできるPOS Tagger

なんか最近こういうのやたら多いね。POSってはpart of speech。品詞のこと。 ウェブブラウザでテキスト投げてやればPOSをタグして返してくれるっていうお手軽サービス。 1. Parts-of-speech.Info - POS tagging online 2. NLTK POS Tagging - API & Demo | T…

名古屋で討論型ワークショップやります!

12/17の名古屋,外国語教育メディア学会中部支部外国語教育基礎研究部会第4回年次例会で討論型ワークショップやります! このワークショップは,(私の得てしてくだらない話題提供のあと)基本的に参加者同士でグループを組んでもらい,想いの丈を共有し合う…

新世代翻訳技術を援用した豊かな人間性を育む英語教育実践

google翻訳すごい。 おそらく10年もしないうちにこういう授業実践が見られるようになるかも。 10年後,新しい能力,より汎用的な能力,就業力,コミュニケーション能力,批判的思考力といった概念が,教育上の成果や目的変数として今以上に重要とされるよう…

観測と解析どっちが大事かという話

観測が大事だというひと。 実験手法,実験方法,実験計画の精密さ,脅威要因を「事前に工夫して」排除する人,実験操作によって交絡変数の影響を取り除こうとする人。 そういう人にとっては,統計解析でデータをごまかすことは本質的ではない。 料理でいうな…

女性の方が英語ができるって話を聞いた時に専門家の端くれとして返すべき一言

巷にあふれるこんな話。 「女性の方がそもそもコミュニケーションが好きだから外国語もできる」(コミュニケーション意欲万能説) 「大体子どもを見ていると女の子のほうが発達がはやいよ。だから外国語もそうだ」(母語獲得投影説) 「英語は女性をエンパワ…

還元主義者が陥ること2題

還元主義一般の話 自分は強烈な還元主義者だと思うのだけど,還元主義の限界は日頃から意識しているつもり。むしろ,意味のなかった還元などについては,一段階前に戻そうと思う時も最近は多くなった。 還元(reduction)とは,たとえば「Aとは結局のところC…

質的成果指標に関する後ろ向き研究:相対危険度とその信頼区間

ある質的な成果指標(ある試験の合格・不合格)がある。テストが終わったあとに,合格した人と不合格だった人に,どの教科書(A,B)を使っていたかそれぞれ聞く。すると以下のようなクロス集計が得られる。このとき,使用した教科書と合格・不合格の関係を…

diffIRT:Diffusion IRTモデルのRパッケージ

たまには真面目なことを記事にしよう。ここ1年くらい夢中になっているDiffusion Modelの話。 Diffusion Modelっていうのは,2値判断課題における正答率と反応時間の分布を<同時に扱う>数理的モデル。「信号検出理論(SDT)に反応時間を足したようなもの」…

ちゃんと勉強してこなかったせいで死ぬほど後悔しているもの

年を取るとやっぱり勉強できなくなる。 業務上必要なのに,自分が怠けて勉強しなかったばっかりに結局はできないままのことも多い。これまで自分がどれだけサボってきたかという,悔しくて仕方ないもの。若いときの過ごし方ってのはやはり大事だと思う。以下…

学習時間の和もガンマ分布って話とか

学習時間(もとい,ICT教材などへのログイン時間)は往々にしてガンマ分布やワイブル分布やその他の親族の分布に従う。もう,これは外国語教育研究の定番でいいんじゃないかと。まあ,記述的には最尤推定して形状母数や尺度母数と対数尤度,AIC,BICなどを報…

因果関係とアカウンタビリティ

厳密な意味での因果関係が不明でもアカウンタビリティは保たれているって場合はよくある。アカウンタビリティをどのように考えるかによるけども。 「過去,学生のうち,平均的に100時間学習した人たちの80%は70点を取った」 「過去,学生のうち,平均的に10…

教育のアカウンタビリティ(と測定):文献メモ

まずはこれ。 www.amazon.co.jp とか, www.amazon.co.jp これを読むのだそう。 あとなんかいろいろあった。最近のも多い。 www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.…

The relationship between A and B in the context of C的なのとか

好きだよねえ。みんな大好き。 Aには(得てして海外で)有名な(そして得てして尺度の翻訳版が確立していない)構成概念 Bには(得てして海外で)有名な(そして得てして尺度の翻訳版が確立していない)別の構成概念 Cには自分の興味のある国,校種など でも…

オッズ比からテトラコリック相関係数への近似変換

テトラコリック相関係数でメタ分析したいときに,先行研究がオッズ比で報告してたりするからどうするんだって話があるそうな。もちろんクロス集計があればいいのだけど,それがないときはどうするか。オッズ比からテトラコリック相関係数の近似値を求める方…

標準偏差の平均?

標準偏差の平均を知りたいという問い合わせ。 評定者が何人かいて,評定者の評定の平均的なばらつきを知りたいのだと。 単純に相加平均しちゃだめで,評定した人の数が一緒だとして,こういうふうにする。 でも,ちょっと微妙。 評定が連続量なのかってのは…

t検定に取って代わるベイズ推定:BESTパッケージ

今更だけど,BESTっていうパッケージなんだって。Bayesian Estimation Supersedes the T-testということでBESTパッケージ。うむうむ。https://cran.r-project.org/web/packages/BEST/vignettes/BEST.pdf CRAN - Package BESTなるほどね。基本はまずJAGSでMCM…

信号検出理論の弁別力と対数オッズ比とベイズ因子と

信号検出理論における被験者反応を4つに分けて(H, Miss, FA, CR)2×2表にしたときの対数オッズ比は,0.6倍すると信号検出理論における弁別力指標d'にまあまあ近似する。なので,大雑把にいえば互いに代用できなくもない。 #データを作る dat<-matrix(c(100,…

集団間の平均値の比較が置いているあまり知られていない仮定

ある種の動機づけの強さについて,性別に由来する差を知りたいと思った。それを測る質問紙(10項目)があるとする。これら10の観測値の平均をもって,この動機づけの強さの値だとみなそう。それで,男女100人ずつくらい集めて,その値の2群の平均値を比べた…

処理速度と反応時間はまったく違うものだってこと

背景 日本の外国語教育研究では,先達のたゆまぬ努力によって1990年代から認知心理学的な研究手法が欧米より徐々に輸入されはじめ,2000年代後半から広く一般化し,今に続く研究の流れを形成した。認知心理学といっても,特に外国語の語彙処理に関わる研究が…

MANOVAをしたときの効果量

なぜか一部の人はMANOVAを嫌うのだけど,MANOVAしたほうがいい場合っていっぱいあると思う。 で,ある統計の相談案件で効果量はどう報告したらいいのっていう話になった。「そういやあまり聞かない」…というのは国内の外国語教育研究で概説が見当たらないっ…

じわじわくる理屈

私たちの友達グループ ある友達のグループで,これまでの人生で付き合ってきたひとの数を集計してみたら,大体真ん中(50%点)ぐらいが12人だったという。世では4人くらいを「普通」だといっているんだけど,私たちの友達グループでは12人を「普通」と呼ぼう…

【数式なしで見てわかる】標準偏差がどうしてもわからない人へ【卒論・修論執筆者向け】

背景 卒業論文や修士論文で,指導教官や先輩,または投稿論文で査読者から「標準偏差」を出しなさいと言われたことがある方も多いと思います。 ただ,「標準偏差とはなにか」を理解することは簡単じゃありません(と考えるひともいるようです)。 ここでは,…

Rで反応時間データの基礎的処理まとめ

これで外国語教育でやるような処理は大体できると思う。ご自由にどうぞ。 library(retimes) #ない場合はインストールすること library(MASS) library(ks) x<-rexgauss(1000,300,200,500) #数値例の生成 #基礎 x<-x[!is.na(x)] #欠損の除外(ここにはない) s…

RでS-P表

まだモックアップ版です。RでS-P表を返します。 ヘッダーつきのデータフレームを入れます。 S-P表を返します。 オプションのplot=TでS CurveとP Curveも描画します。 このデフォルトはTです。 sp<-function(dat,plot=T){ dat[order(apply(dat,1,sum),decreas…

なぜ第二言語習得研究がさっぱりわからないか

第二言語習得研究(一応はそういう名前の授業の単位は大学院で取ってあるレベル)が一般的な教育従事者にとってさほど魅力的でないということはさまざまな先生がいっておられる。そして2015年の今日では,それはさほど真新しい見方でもない。でも,「なぜ」…

見張りは誰が見張るのか?

データが得られる過程 vs. 変数の質 最近,エビデンス,エビデンスと聞くけども,でも,EBM(証拠にもとづく医療)を他の分野に適用するには(基本的には賛成側なのだけど),ちょっとだけ慎重性を要する側面もあると思っている。それは学問自体の背景につい…

実践研究の報告におけるPICOについて

夏の学会でたくさんの発表を見て,あることについて思った。わたしは実践研究や授業実践に関わるものを優先してみたのだけど,簡単にいえば,PICOとかのこと。 PICOっていうのは,EBM(Evidence-Based Medicine)とかに関連していわれる研究の事例報告のガイド…

1970年代における英語教育の科学化運動って?

日本の英語教育研究史にパーソナルな興味をもっています。英語教育研究史は,もちろん日本の英語史に等しい歴史をもっていそうですが,わたしは,そのなかでも,ごく最近の歴史,1970年以降(昭和40年以降)に注目しています。資料がほぼ完璧に現存し,さら…

項目関連構造分析(item relational structure analysis)メモ

項目関連構造分析(item relational structure analysis)っていうのがあって,すごくアルゴリズムが簡単みたいなので,教育現場でも使えればいいとおもう。でも簡単に使えそうな道具がない。Excelでもできるのだけど… すぐ見れそうな関連論文は… CiNii 論文…

部分積率(partial moment)を使った教育的処遇の効果検証

背景:教育的処遇の効果をみるさまざまな方法 (某先生を真似して会話形式で) 教師:ちょっと工夫した指導をして,事前事後のデータとったった。 平均差を見る専門家:おお!10点平均点が伸びてる!これは効果的な指導法だ! 統計的仮説検定をする専門家:…

クロス集計をあえて散布図みたいに可視化する:Rの関数つき

背景 たいていの質問紙の項目に対する回答は,離散的な値を取る。 1, 2, 3, 4, 5みたいな。リッカート尺度みたいな場合ね。 ここである質問項目iの回答と質問項目jの回答をみたい。 5件とか7件のリッカート尺度だと,(ピアソンの)相関係数を出したりするこ…

幾何分布関係メモ:Rで乱数発生,最尤推定,負の二項回帰

幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…

分布の裾あれこれ:Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…

「カタチ」で見る集団に対する処遇の結果

はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…

実践報告やアクションリサーチにおいて統計分析は必要ない?

前までのシリーズはちょっとおやすみ。 ちょっと,ここで気になる話について書いてみる。 実践報告 よく,日本の外国語教育に関わる諸学会では,実践報告という枠が発表や論文に対してあって,そこでは,実際におこなっている指導内容などについて報告するこ…

効果量では見えない指導の効果(8):外国語教育での実例(事前ー事後)

さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. &lt;a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

効果量では見えない指導の効果(7):外国語教育での実例(実験群―統制群)

今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…

効果量では見えない指導の効果(6):分位点回帰

1. これまでのおさらい 前回は,事前-事後の成績の比較について, (1)効果量には,相関を考慮するものと,しないものがある (2)いずれにせよ,事前-事後の比較では,平均差,標準偏差だけではなく,相関係数(r)や分散比(F)が重要になる場合もある …

効果量では見えない指導の効果(5):繰り返しのデータ

1. 事前と事後の間の比較 これまでは統制群と実験群の比較についてみたけど,これからは事前と事後の間。 もちろん,繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分,意思決定ができる場合もあるだろうけど,ちょっともっと他の情報…

効果量では見えない指導の効果(4):データの歪みと分布の情報

1. 歪んだデータで効果の検証? わたしが申しあげるまでもなく,外国語教育のデータはきたない。もちろんテーマなどによるけど。 たとえば,もし仮にこんなデータがあったとしよう(よくありそう)。 黒が統制群,赤が実験群で,postテストの成績だとしてみ…

効果量では見えない指導の効果(3):目標規準準拠のとき

1. 集団基準準拠と目標規準準拠の差 第二言語習得研究や,外国語教育研究のうちの,一部のアカデミック寄りな観点では,第二言語なり外国語の熟達度に関する構成概念を対象として測定をおこなうことが多い。ほとんどの構成概念は,熟達度になんらかの影響を…

効果量では見えない指導の効果(2):解釈のための工夫

背景 自分のメモのためにも続き。 前回は: 効果量では見えない指導の効果(1) - 草薙の研究ログ 効果量では見えない指導の効果(1) - 草薙の研究ログ さて,前回では, (1)外国語教育の実務的観点では,学習・指導の効果を効果量のみで議論することはそ…

効果量では見えない指導の効果

実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証…

NEDV(nonequivalent dependent variables design)のススメ

なにかの指導法の効果をみるとき,われわれはふつう無作為標本化はできないので,準実験計画,なかでも異なるグループ間で事前事後などをくらべるデザイン,NEGD(the nonequivalent group design)というのをやる。非等集団計画とかいう?こんな感じのおな…