読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

閉まらなくなったファスナーを直す

ファスナーって,たまに使いすぎたりすると馬鹿になってしまう。 先日,超お気に入りのクラッチバッグのファスナーが馬鹿になってしまった。 スライダーは動くのだけど,うまくエレメントを噛んでくれなくなって,閉めているはずがスライダーのけつから開い…

因果関係とアカウンタビリティ

厳密な意味での因果関係が不明でもアカウンタビリティは保たれているって場合はよくある。アカウンタビリティをどのように考えるかによるけども。 「過去,学生のうち,平均的に100時間学習した人たちの80%は70点を取った」 「過去,学生のうち,平均的に10…

こなした問題数,学習時間,オンライン教材へのログイン時間といったデータの分析

オンライン教材へのログイン時間といった学習履歴は,現在の外国語教育現場では容易に得られるようになってきていて,(主に探索的な目論見で)分析に組み込まれることが多くなってきている。しかし外国語教育研究ではこういったデータの分析の歴史は浅く,…

教育のアカウンタビリティ(と測定):文献メモ

まずはこれ。 www.amazon.co.jp とか, www.amazon.co.jp これを読むのだそう。 あとなんかいろいろあった。最近のも多い。 www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.amazon.co.jp www.…

The relationship between A and B in the context of C的なのとか

好きだよねえ。みんな大好き。 Aには(得てして海外で)有名な(そして得てして尺度の翻訳版が確立していない)構成概念 Bには(得てして海外で)有名な(そして得てして尺度の翻訳版が確立していない)別の構成概念 Cには自分の興味のある国,校種など でも…

層別の記述統計

あるテストを実施したとき,クラスごとに合計得点をもとめたいとか,そういうことって外国語教育ではよくある(そういうことしかない気もする)。 男女とか,3クラスとかだったらね,記述統計をエクセルでそれぞれ手動でもとめてもいいかもだけど,20クラス…

metacorパッケージで相関係数のメタ分析

Rのメタ分析パッケージ多すぎて何がなんだかなんだけど,相関係数関係はmetacorってのがシンプル。rmeta風ね。 https://cran.r-project.org/web/packages/metacor/metacor.pdf #パッケージの準備 install.packages("metacor") library(metacor) #データの準…

オッズ比からテトラコリック相関係数への近似変換

テトラコリック相関係数でメタ分析したいときに,先行研究がオッズ比で報告してたりするからどうするんだって話があるそうな。もちろんクロス集計があればいいのだけど,それがないときはどうするか。オッズ比からテトラコリック相関係数の近似値を求める方…

標準偏差の平均?

標準偏差の平均を知りたいという問い合わせ。 評定者が何人かいて,評定者の評定の平均的なばらつきを知りたいのだと。 単純に相加平均しちゃだめで,評定した人の数が一緒だとして,こういうふうにする。 でも,ちょっと微妙。 評定が連続量なのかってのは…

t検定に取って代わるベイズ推定:BESTパッケージ

今更だけど,BESTっていうパッケージなんだって。Bayesian Estimation Supersedes the T-testということでBESTパッケージ。うむうむ。https://cran.r-project.org/web/packages/BEST/vignettes/BEST.pdf CRAN - Package BESTなるほどね。基本はまずJAGSでMCM…

Rの図の中の字をTImes New Romanにしたい?

…という矢の問い合わせ。基本図の中はサンセリフでいいと思うんだけど,わざわざこういう指定のジャーナルもあるんだそう。 なるほど。 windowsFonts(TNR = windowsFont("Times New Roman")) par(family="TNR") x<-data.frame("How about"=rnorm(100),"this"…

論文数の年間ノルマ

どうも目指す職業の職務的技能に関する適性に恵まれなかったようで、書くのが嫌でしかたない。というか職務的技能の中で特に研究に関してはどうにかならないものかといつも頭を悩ませている。勉強するのは苦手でないしまあ好きだ。むしろインプットは得意か…

相関係数の解釈と効果量の解釈

相関係数は標準化された共分散。 共分散は偏差積の平均値。 偏差は平均との距離。なので、片方の変数が平均から離れている度合いと、もう片方の変数の平均から離れている度合いをかけたものの平均から、スケールの大きさを取り除いたもの。数学的な含意は、…

SATと識別力

識別力が低い項目ばかりのとき、被験者の(古典的テスト理論的な意味での)正答率と反応時間の中心の相関(普通は負の値)は必然的に小さくなる。スピードに関わる課題操作が正答率に及ぼす影響も小さくなる。刺激の条件間で2つの相関に違いがあるとき、まず…

正答率と反応時間のスケール特性

正答率は0から1までの範囲しか取らない。 正答率は平均が0か1に近づくと分散は小さくなる。反応時間は非負で最小値がある。 反応時間は平均が高くなると分散も大きくなる。当たり前だけど大事なことなのでメモ。

SATと項目困難度

一般に被験者間でみたときに、定数であるところの能力が高い人は、低い人に比べて早く正確に問題を解く。この関係(被験者の回答時間と正答率の共分散)は、問題が難しくなるにつれ大きくなる。一般に項目間でみたときに、定数であるところの難しい問題は簡…

信号検出理論の弁別力と対数オッズ比とベイズ因子と

信号検出理論における被験者反応を4つに分けて(H, Miss, FA, CR)2×2表にしたときの対数オッズ比は,0.6倍すると信号検出理論における弁別力指標d'にまあまあ近似する。なので,大雑把にいえば互いに代用できなくもない。 #データを作る dat<-matrix(c(100,…

発表はスライド投影かハンドアウトか

時代とその時々のインフラによって物事のスタイルはよく変わる。物事自体はあまり変わらないのだけど。私が学部生のときには既に、プレゼンといえばスライド投影だった。Microsoftのパワポを使うのがかなり一般化していたので、当時からスライド投影のことを…

富豪的分析

直接ではないが師匠筋にあたる(むしろ私の指導教官とみなされることがかなり多い)O先生が、私の後輩たちに増井先生の富豪的プログラミングについて語ったという。私はプログラミングに関して素人同然なので必然的に富豪的なんだけど、富豪的ってのは時と場…

RとHSPで簡単に実行形式型高度UI統計ソフトの実装

RはCUIだから絶対に嫌という層は一定数いる。ならUIつけたらいいじゃない。 HSPは書くのがハイパー簡単だし簡単なUIを作るのに適している。ただ高度な計算がめんどい。なのでHSPでUIを作って、そのUIからRを走らせたい。基本的な方針としてはHSPで被せた実行…

ニーズ,現実認識,そしてポリシーとそれらの間の

ご尊名をお書きしてもよいものかと悩んでいたけども,結局伏せさせていただくことにする。 K先生とおっしゃる先生がいらして,近くの大学にお勤めなのだけど,指導を頂いた師匠筋というわけではなく,あくまでも私淑するに留まる関係性。でも幸いにも,先生…

集団間の平均値の比較が置いているあまり知られていない仮定

ある種の動機づけの強さについて,性別に由来する差を知りたいと思った。それを測る質問紙(10項目)があるとする。これら10の観測値の平均をもって,この動機づけの強さの値だとみなそう。それで,男女100人ずつくらい集めて,その値の2群の平均値を比べた…

処理速度と反応時間はまったく違うものだってこと

背景 日本の外国語教育研究では,先達のたゆまぬ努力によって1990年代から認知心理学的な研究手法が欧米より徐々に輸入されはじめ,2000年代後半から広く一般化し,今に続く研究の流れを形成した。認知心理学といっても,特に外国語の語彙処理に関わる研究が…

因子分析は特定の観測変数の構成概念判定機ではないってこと(2)

前回のおさらい さて,続き続き。 「観測変数の相関が高いってだけで,同じものを測っているとはいえない」という話でした。 構成概念妥当性観のことを言い出すと私は延々と止まらくなるので自重するけど,これは,観測変数の相関係数をもとめることが実質科…

因子分析は特定の観測変数の構成概念判定機ではないってこと(1)

外国語教育の研究者の中には,「相関係数の値が高ければそれらふたつの変数は同じものを測っている(またはその度合いが高い)」っていう信念を強く持っているひとが多い。 そんなにひどい間違いではないと思うの。 でも,それは微妙にヒューリスティックが…

違う能力?

バッティングセンターにいくとして,100kmから160kmまですこしずつ球速を上げていくとする。100kmだと60%は打てるんだんけど,110kmになればけっこうきついわ,20%は切るな。160kmなんてほぼ無理だ。 ――って考えるとする。 理想的にはこんな感じ。 でもこの…

モンテカルロ的なt検定のシミュレーション

検定力のシミュレーションに使えるかも。 はっきり言って意味はない。 #2標本のt検定(対応なし,Welch) mcpower2<-function(b,n1,n2,m1,m2,sd1,sd2){ p<-numeric(b) for(i in 1:b){ s1<-rnorm(n1,m1,sd1) s2<-rnorm(n2,m2,sd2) p[i]<-t.test(s1,s2)[[3]] }…

ちょっと嫌な論文の表現

自分でもたいそう長いことそういうふうに書いてたのだけど、例えば「ある実験的操作が反応時間に影響を及ぼすか」みたいな研究課題は、論文として許されるのだろうけど途方もないくらい馬鹿らしい。そんなことはある筈がない。いや、あるといえばあるかもだ…

MANOVAをしたときの効果量

なぜか一部の人はMANOVAを嫌うのだけど,MANOVAしたほうがいい場合っていっぱいあると思う。 で,ある統計の相談案件で効果量はどう報告したらいいのっていう話になった。「そういやあまり聞かない」…というのは国内の外国語教育研究で概説が見当たらないっ…

じわじわくる理屈

私たちの友達グループ ある友達のグループで,これまでの人生で付き合ってきたひとの数を集計してみたら,大体真ん中(50%点)ぐらいが12人だったという。世では4人くらいを「普通」だといっているんだけど,私たちの友達グループでは12人を「普通」と呼ぼう…

反応時間データをBox-Cox変換する

そういえば去年のFrontiers in Psychologyに反応時間データの処理についての論文があった。 いろんな変換とか外れ値除去したりする方法をシミュレーションで試したけど,Box-Cox変換をλ = -1でやるのがいいぞ!という変な推しだった。まあ,いいけど。反応時…

多変量上の群間の中心差に関する効果量としてのマハラノビス距離と情報量?

ある指導法Aの効果をみたいとする。 NEGD(群間計画)を組めたとする。 処遇後における処置群と統制群の中心傾向の差をもって効果と考えたい。 このとき,結果変数として2変数もっているとする。 文法テストと語彙テスト。 このとき,効果量としてもちいるべ…

【R】マハラノビス距離のもとめ方と判別

Rでマハラノビス距離をもとめるためには,mahalanobis関数を使う。 勉強用に書いてみた。マハラノビス距離自体は,やっぱり英語のwiki先生が詳しい。Mahalanobis distance - Wikipedia, the free encyclopedia #2変量のマハラノビス距離をもとめる #数値例の…

Rで逆正規分布の確率密度関数,累積分布関数,乱数発生

逆正規分布(逆ガウス分布,Inverse Gaussian Distribution)は,反応時間の分析で使ったりすることがあるらしい。歪んでいるので。2母数の連続型分布で,形状パラミタ(λ)と平均(μ)をもつ。 相変わらず英語のwiki先生は統計と数学に詳しい。Inverse Gaus…

【数式なしで見てわかる】標準偏差がどうしてもわからない人へ【卒論・修論執筆者向け】

背景 卒業論文や修士論文で,指導教官や先輩,または投稿論文で査読者から「標準偏差」を出しなさいと言われたことがある方も多いと思います。 ただ,「標準偏差とはなにか」を理解することは簡単じゃありません(と考えるひともいるようです)。 ここでは,…

Windows10のアップグレードはRAMDISKを勝手に外すという罠

心情としてはLinux派(のエンドユーザー)なのだが,これまでどうしてもMS Officeでやらなきゃいけないことが多いので,Windows 7も使っていた。 ThinkPad Tシリーズなのだけど,RAMが4GB余っていたので,RAMDISKとしてTMPファイルなどいろいろ割り当ててい…

Rで反応時間データの基礎的処理まとめ

これで外国語教育でやるような処理は大体できると思う。ご自由にどうぞ。 library(retimes) #ない場合はインストールすること library(MASS) library(ks) x<-rexgauss(1000,300,200,500) #数値例の生成 #基礎 x<-x[!is.na(x)] #欠損の除外(ここにはない) s…

【初心者向け】外国語教育研究者がRを入れたらインストールしたい10のパッケージ【貼るだけ】

外国語教育の研究者で,Rとりあえずインストールしたけど,何ができるかわからない,という方。とりあえず以下の様なパッケージを入れておいてはどうでしょうか。 psych:汎用心理学系分析パッケージ,主に信頼性係数や因子分析に使う lavaan:潜在変数分析用…

文系院生にとって最強の研究環境とはなにか

自分でもきちんとできていないのだけど,もちろん,OSはLinux系だと思う。それで基本的には,(GNU)emacsの中にひきこもっちゃう。やはりemacs。 emacsでメールを送受信して,emacsでスケジュール管理して,emacsでpdf開いちゃう。論文を書くときは野鳥(ya…

RでS-P表

まだモックアップ版です。RでS-P表を返します。 ヘッダーつきのデータフレームを入れます。 S-P表を返します。 オプションのplot=TでS CurveとP Curveも描画します。 このデフォルトはTです。 sp<-function(dat,plot=T){ dat[order(apply(dat,1,sum),decreas…

【2015年度版】文系院生へのlinux OSのススメ【lubuntuいいよ】

lubuntuかわいいよ好きよ 背景 文系院生に必要な研究環境は,はっきりいって以下の要件に尽きる。 pdfが閲覧できること ネット・ブラウジングができること メールの送受信ができること オフィススイートを備えていること (人によって)ターミナル上で文字処…

なぜ第二言語習得研究がさっぱりわからないか

第二言語習得研究(一応はそういう名前の授業の単位は大学院で取ってあるレベル)が一般的な教育従事者にとってさほど魅力的でないということはさまざまな先生がいっておられる。そして2015年の今日では,それはさほど真新しい見方でもない。でも,「なぜ」…

見張りは誰が見張るのか?

データが得られる過程 vs. 変数の質 最近,エビデンス,エビデンスと聞くけども,でも,EBM(証拠にもとづく医療)を他の分野に適用するには(基本的には賛成側なのだけど),ちょっとだけ慎重性を要する側面もあると思っている。それは学問自体の背景につい…

Rコードいろいろ

このブログやHPなどで,いろんなRのコードを書いてきたのだけど,そしてそれはほとんど自分のためなのだけど,私自身が自分で探すのもメンドくなってきてしまったので,.txtにベタ打ちしたやつをダウンロードできるようにまとめていくことにした。これから充…

Ex-Gaussian分布の累積分布関数:Rコード

前よくわからないから 積分でやったんだけど,調べたらwikipediaにあったから関数作ったった。wikipediaすげえな。でも700円のコーヒーを飲む層ではないんだ俺。 pexgauss<-function(x,mu,sigma,tau){ tau<-1/tau u<-tau*(x-mu) v<-tau*sigma phi1<-pnorm(u,…

検定力についてわかったようなわからないような人がもっとわかったというようなグラフ

Ex-Gaussian分布の累積分布確率

r

Ex-Gaussian分布の累積分布確率をもとめる方程式が分からないので(わたしが馬鹿だというのと調べるのがメンドイ),retimesパッケージの確率密度関数dexgaussで出したのをintegrate関数で数値積分して出してしまえ的な。 でもretimesは使ってない。このまま…

実践研究の報告におけるPICOについて

夏の学会でたくさんの発表を見て,あることについて思った。わたしは実践研究や授業実践に関わるものを優先してみたのだけど,簡単にいえば,PICOとかのこと。 PICOっていうのは,EBM(Evidence-Based Medicine)とかに関連していわれる研究の事例報告のガイド…

1/0の正誤データから信号検出理論:Rの自作関数

背景 手元に判断課題のデータがあって,信号検出理論の指標を出したいとする。大概の信号検出理論指標は計算が簡単なのでExcelでもできるのだけど,大量データだと結構面倒くさい。 信号検出理論では,反応を4種類に分ける。 Hit, Miss, CR, FA。 これを数え…

【メモ】反映的モデル(reflective model)と形成的モデル(formative model)

観測変数と潜在変数の関係性についての話。博論関係のメモ。 基本的には関係変数と潜在変数の関係性は2種類に分けて理解できる。結果指標モデルないし反映的モデル(reflective model)と原因指標モデルないし形成的モデル(formativeモデル)。日本語訳とし…