草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

r

t検定に取って代わるベイズ推定:BESTパッケージ

今更だけど,BESTっていうパッケージなんだって。Bayesian Estimation Supersedes the T-testということでBESTパッケージ。うむうむ。https://cran.r-project.org/web/packages/BEST/vignettes/BEST.pdf CRAN - Package BESTなるほどね。基本はまずJAGSでMCM…

Rの図の中の字をTImes New Romanにしたい?

…という矢の問い合わせ。基本図の中はサンセリフでいいと思うんだけど,わざわざこういう指定のジャーナルもあるんだそう。 なるほど。 windowsFonts(TNR = windowsFont("Times New Roman")) par(family="TNR") x<-data.frame("How about"=rnorm(100),"this"…

信号検出理論の弁別力と対数オッズ比とベイズ因子と

信号検出理論における被験者反応を4つに分けて(H, Miss, FA, CR)2×2表にしたときの対数オッズ比は,0.6倍すると信号検出理論における弁別力指標d'にまあまあ近似する。なので,大雑把にいえば互いに代用できなくもない。 #データを作る dat<-matrix(c(100,…

処理速度と反応時間はまったく違うものだってこと

背景 日本の外国語教育研究では,先達のたゆまぬ努力によって1990年代から認知心理学的な研究手法が欧米より徐々に輸入されはじめ,2000年代後半から広く一般化し,今に続く研究の流れを形成した。認知心理学といっても,特に外国語の語彙処理に関わる研究が…

MANOVAをしたときの効果量

なぜか一部の人はMANOVAを嫌うのだけど,MANOVAしたほうがいい場合っていっぱいあると思う。 で,ある統計の相談案件で効果量はどう報告したらいいのっていう話になった。「そういやあまり聞かない」…というのは国内の外国語教育研究で概説が見当たらないっ…

じわじわくる理屈

私たちの友達グループ ある友達のグループで,これまでの人生で付き合ってきたひとの数を集計してみたら,大体真ん中(50%点)ぐらいが12人だったという。世では4人くらいを「普通」だといっているんだけど,私たちの友達グループでは12人を「普通」と呼ぼう…

多変量上の群間の中心差に関する効果量としてのマハラノビス距離と情報量?

ある指導法Aの効果をみたいとする。 NEGD(群間計画)を組めたとする。 処遇後における処置群と統制群の中心傾向の差をもって効果と考えたい。 このとき,結果変数として2変数もっているとする。 文法テストと語彙テスト。 このとき,効果量としてもちいるべ…

【R】マハラノビス距離のもとめ方と判別

Rでマハラノビス距離をもとめるためには,mahalanobis関数を使う。 勉強用に書いてみた。マハラノビス距離自体は,やっぱり英語のwiki先生が詳しい。Mahalanobis distance - Wikipedia, the free encyclopedia #2変量のマハラノビス距離をもとめる #数値例の…

Rで逆正規分布の確率密度関数,累積分布関数,乱数発生

逆正規分布(逆ガウス分布,Inverse Gaussian Distribution)は,反応時間の分析で使ったりすることがあるらしい。歪んでいるので。2母数の連続型分布で,形状パラミタ(λ)と平均(μ)をもつ。 相変わらず英語のwiki先生は統計と数学に詳しい。Inverse Gaus…

Rで反応時間データの基礎的処理まとめ

これで外国語教育でやるような処理は大体できると思う。ご自由にどうぞ。 library(retimes) #ない場合はインストールすること library(MASS) library(ks) x<-rexgauss(1000,300,200,500) #数値例の生成 #基礎 x<-x[!is.na(x)] #欠損の除外(ここにはない) s…

Ex-Gaussian分布の累積分布関数:Rコード

前よくわからないから 積分でやったんだけど,調べたらwikipediaにあったから関数作ったった。wikipediaすげえな。でも700円のコーヒーを飲む層ではないんだ俺。 pexgauss<-function(x,mu,sigma,tau){ tau<-1/tau u<-tau*(x-mu) v<-tau*sigma phi1<-pnorm(u,…

検定力についてわかったようなわからないような人がもっとわかったというようなグラフ

Ex-Gaussian分布の累積分布確率

r

Ex-Gaussian分布の累積分布確率をもとめる方程式が分からないので(わたしが馬鹿だというのと調べるのがメンドイ),retimesパッケージの確率密度関数dexgaussで出したのをintegrate関数で数値積分して出してしまえ的な。 でもretimesは使ってない。このまま…

1/0の正誤データから信号検出理論:Rの自作関数

背景 手元に判断課題のデータがあって,信号検出理論の指標を出したいとする。大概の信号検出理論指標は計算が簡単なのでExcelでもできるのだけど,大量データだと結構面倒くさい。 信号検出理論では,反応を4種類に分ける。 Hit, Miss, CR, FA。 これを数え…

効果量(Cohen's d)と分布の重なり:RでCohen's dから共有面積への変換スクリプト

r

背景 効果量のCohen's dは2変数の分布の重なりの程度だとも解釈できる。 こういうこと。 くわしくは浦野先生(2013)など。 LET2013 workshop | ひとりごと ただし,これは(想定上の)母集団についての話。 さらにCohen's dは,プールされた標準偏差を使う…

【FAQ】2×2のクロス集計への検定,標準回帰係数

r faq

最近受けた統計の質問。 カイ二乗じゃなくてG検定をやれ? これはこの前行われたCELESの,私のワークショップのときに,ある先生からご質問頂いたのだけれども,ちょっと事例が個別すぎたので,その場ではお答えできなかったもの。こちらから連絡差し上げら…

Cliff's deltaや共通言語効果量(common language effect size)などを計算するRパッケージ:"orddom"

これはすごい便利。エンドユーザー向けでだれでも使えそう。 orddomというの。ordinal dominance statisticsの略かな。 共通言語効果量とか,Cliff's deltaとか一気に出してくれる。 対比較とかこれで結構いける的な。 Rogmann, J. J. (2013). Ordinal Domin…

外れ値を含むデータに対する効果量:正規化四分位区間と中央値を使ったほんのちょっとだけ頑健な方法

背景 こんなデータを作ります。対応なしの2群のデータ(x, y)です。 xは,平均50,標準偏差10の正規分布に従う乱数39個です。 yは,平均55,標準偏差10の正規分布に従う乱数39個です。 なので,理論的には,こんな感じになり, 効果量(標準化平均差)は0.5…

どう見ても違うものを同じという怖さ

どう見ても違う 直球でいこう。こういうこと。 てい! 効果量の値は同じ!でもどうみてもぜんぜん違う! 情報の集約あれこれ雑感 最近よく, みたいな表を見るようになった。*1 情報の集約として,別に悪いとは思わない。*2 集約の程度が大きい,ということ…

カーネル密度推定からその後:ksパッケージ

背景 正規分布を逸脱したデータの累積分布曲線を描きたい。 たとえば,こんなデータってことにしよう。 このデータは, c(rnorm(100.-5,1),rnorm(100,5,1))->dat こうやってつくろう。 Nが200もあれば,quantile関数で, で,こんな感じにできる。 でもこれ…

項目関連構造分析(item relational structure analysis)メモ

項目関連構造分析(item relational structure analysis)っていうのがあって,すごくアルゴリズムが簡単みたいなので,教育現場でも使えればいいとおもう。でも簡単に使えそうな道具がない。Excelでもできるのだけど… すぐ見れそうな関連論文は… CiNii 論文…

部分積率(partial moment)を使った教育的処遇の効果検証

背景:教育的処遇の効果をみるさまざまな方法 (某先生を真似して会話形式で) 教師:ちょっと工夫した指導をして,事前事後のデータとったった。 平均差を見る専門家:おお!10点平均点が伸びてる!これは効果的な指導法だ! 統計的仮説検定をする専門家:…

クロス集計をあえて散布図みたいに可視化する:Rの関数つき

背景 たいていの質問紙の項目に対する回答は,離散的な値を取る。 1, 2, 3, 4, 5みたいな。リッカート尺度みたいな場合ね。 ここである質問項目iの回答と質問項目jの回答をみたい。 5件とか7件のリッカート尺度だと,(ピアソンの)相関係数を出したりするこ…

外国語教育で極値統計・VaR・期待ショートフォール:自分用メモ

極値統計 極値分布:最小値や最大値が(漸近的に)従う分布。リスク管理などで使われる。 一般極値分布(generalized extreme value distribution, GEV)は,3つのパラミターをもつ。 位置パラミター スケールパラミター 形状パラミター 形状パラミターの値…

幾何分布関係メモ:Rで乱数発生,最尤推定,負の二項回帰

幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…

分布の裾あれこれ:Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…

論文で報告されていない相関係数をサルベージ!(Rの関数つき)

背景 対応のあるデータの論文で,あるある。 平均値と標準偏差のペアが報告されている,よしよし。 対応のあるt検定の検定統計量が報告されている,ふむふむ。 でも相関係数や分散共分散行列が報告されていない!なんでだよー。。。 たとえば,標準化効果量…

「カタチ」で見る集団に対する処遇の結果

はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…

効果量では見えない指導の効果(8):外国語教育での実例(事前ー事後)

さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. &lt;a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

効果量では見えない指導の効果(7):外国語教育での実例(実験群―統制群)

今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…