読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

Ex-Gaussian分布の累積分布関数:Rコード

前よくわからないから 積分でやったんだけど,調べたらwikipediaにあったから関数作ったった。wikipediaすげえな。でも700円のコーヒーを飲む層ではないんだ俺。 pexgauss<-function(x,mu,sigma,tau){ tau<-1/tau u<-tau*(x-mu) v<-tau*sigma phi1<-pnorm(u,…

検定力についてわかったようなわからないような人がもっとわかったというようなグラフ

実践研究の報告におけるPICOについて

夏の学会でたくさんの発表を見て,あることについて思った。わたしは実践研究や授業実践に関わるものを優先してみたのだけど,簡単にいえば,PICOとかのこと。 PICOっていうのは,EBM(Evidence-Based Medicine)とかに関連していわれる研究の事例報告のガイド…

1/0の正誤データから信号検出理論:Rの自作関数

背景 手元に判断課題のデータがあって,信号検出理論の指標を出したいとする。大概の信号検出理論指標は計算が簡単なのでExcelでもできるのだけど,大量データだと結構面倒くさい。 信号検出理論では,反応を4種類に分ける。 Hit, Miss, CR, FA。 これを数え…

Cliff's deltaや共通言語効果量(common language effect size)などを計算するRパッケージ:"orddom"

これはすごい便利。エンドユーザー向けでだれでも使えそう。 orddomというの。ordinal dominance statisticsの略かな。 共通言語効果量とか,Cliff's deltaとか一気に出してくれる。 対比較とかこれで結構いける的な。 Rogmann, J. J. (2013). Ordinal Domin…

奇妙な統計分析全選手入場

全選手入場!!手計算時代はまだ生きていた!! 更なる研鑚を積みあの伝説が甦った!!! n.s.表記だァ――――!!!奇妙な統計分析はすでに我々が完成している!!有意傾向を素知らぬ顔で有意扱いだァ――――!!!項目の数だけ検定かけまくってやる!! 質問項目全部t検定だァッ…

外れ値を含むデータに対する効果量:正規化四分位区間と中央値を使ったほんのちょっとだけ頑健な方法

背景 こんなデータを作ります。対応なしの2群のデータ(x, y)です。 xは,平均50,標準偏差10の正規分布に従う乱数39個です。 yは,平均55,標準偏差10の正規分布に従う乱数39個です。 なので,理論的には,こんな感じになり, 効果量(標準化平均差)は0.5…

どう見ても違うものを同じという怖さ

どう見ても違う 直球でいこう。こういうこと。 てい! 効果量の値は同じ!でもどうみてもぜんぜん違う! 情報の集約あれこれ雑感 最近よく, みたいな表を見るようになった。*1 情報の集約として,別に悪いとは思わない。*2 集約の程度が大きい,ということ…

カーネル密度推定からその後:ksパッケージ

背景 正規分布を逸脱したデータの累積分布曲線を描きたい。 たとえば,こんなデータってことにしよう。 このデータは, c(rnorm(100.-5,1),rnorm(100,5,1))->dat こうやってつくろう。 Nが200もあれば,quantile関数で, で,こんな感じにできる。 でもこれ…

項目関連構造分析(item relational structure analysis)メモ

項目関連構造分析(item relational structure analysis)っていうのがあって,すごくアルゴリズムが簡単みたいなので,教育現場でも使えればいいとおもう。でも簡単に使えそうな道具がない。Excelでもできるのだけど… すぐ見れそうな関連論文は… CiNii 論文…

部分積率(partial moment)を使った教育的処遇の効果検証

背景:教育的処遇の効果をみるさまざまな方法 (某先生を真似して会話形式で) 教師:ちょっと工夫した指導をして,事前事後のデータとったった。 平均差を見る専門家:おお!10点平均点が伸びてる!これは効果的な指導法だ! 統計的仮説検定をする専門家:…

クロス集計をあえて散布図みたいに可視化する:Rの関数つき

背景 たいていの質問紙の項目に対する回答は,離散的な値を取る。 1, 2, 3, 4, 5みたいな。リッカート尺度みたいな場合ね。 ここである質問項目iの回答と質問項目jの回答をみたい。 5件とか7件のリッカート尺度だと,(ピアソンの)相関係数を出したりするこ…

外国語教育で極値統計・VaR・期待ショートフォール:自分用メモ

極値統計 極値分布:最小値や最大値が(漸近的に)従う分布。リスク管理などで使われる。 一般極値分布(generalized extreme value distribution, GEV)は,3つのパラミターをもつ。 位置パラミター スケールパラミター 形状パラミター 形状パラミターの値…

幾何分布関係メモ:Rで乱数発生,最尤推定,負の二項回帰

幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…

分布の裾あれこれ:Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…

論文で報告されていない相関係数をサルベージ!(Rの関数つき)

背景 対応のあるデータの論文で,あるある。 平均値と標準偏差のペアが報告されている,よしよし。 対応のあるt検定の検定統計量が報告されている,ふむふむ。 でも相関係数や分散共分散行列が報告されていない!なんでだよー。。。 たとえば,標準化効果量…

「カタチ」で見る集団に対する処遇の結果

はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…

実践報告やアクションリサーチにおいて統計分析は必要ない?

前までのシリーズはちょっとおやすみ。 ちょっと,ここで気になる話について書いてみる。 実践報告 よく,日本の外国語教育に関わる諸学会では,実践報告という枠が発表や論文に対してあって,そこでは,実際におこなっている指導内容などについて報告するこ…

効果量では見えない指導の効果(8):外国語教育での実例(事前ー事後)

さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. &lt;a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

効果量では見えない指導の効果(7):外国語教育での実例(実験群―統制群)

今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…

効果量では見えない指導の効果(6):分位点回帰

1. これまでのおさらい 前回は,事前-事後の成績の比較について, (1)効果量には,相関を考慮するものと,しないものがある (2)いずれにせよ,事前-事後の比較では,平均差,標準偏差だけではなく,相関係数(r)や分散比(F)が重要になる場合もある …

効果量では見えない指導の効果(5):繰り返しのデータ

1. 事前と事後の間の比較 これまでは統制群と実験群の比較についてみたけど,これからは事前と事後の間。 もちろん,繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分,意思決定ができる場合もあるだろうけど,ちょっともっと他の情報…

効果量では見えない指導の効果(4):データの歪みと分布の情報

1. 歪んだデータで効果の検証? わたしが申しあげるまでもなく,外国語教育のデータはきたない。もちろんテーマなどによるけど。 たとえば,もし仮にこんなデータがあったとしよう(よくありそう)。 黒が統制群,赤が実験群で,postテストの成績だとしてみ…

効果量では見えない指導の効果(3):目標規準準拠のとき

1. 集団基準準拠と目標規準準拠の差 第二言語習得研究や,外国語教育研究のうちの,一部のアカデミック寄りな観点では,第二言語なり外国語の熟達度に関する構成概念を対象として測定をおこなうことが多い。ほとんどの構成概念は,熟達度になんらかの影響を…

効果量では見えない指導の効果(2):解釈のための工夫

背景 自分のメモのためにも続き。 前回は: 効果量では見えない指導の効果(1) - 草薙の研究ログ 効果量では見えない指導の効果(1) - 草薙の研究ログ さて,前回では, (1)外国語教育の実務的観点では,学習・指導の効果を効果量のみで議論することはそ…

効果量では見えない指導の効果

実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証…

NEDV(nonequivalent dependent variables design)のススメ

なにかの指導法の効果をみるとき,われわれはふつう無作為標本化はできないので,準実験計画,なかでも異なるグループ間で事前事後などをくらべるデザイン,NEGD(the nonequivalent group design)というのをやる。非等集団計画とかいう?こんな感じのおな…

連続変数とカテゴリカル変数が混ざった潜在クラス分析

潜在クラス分析をRでやるpoLCAは名にし負わばでpoだし,混合分布モデルのmclustパッケージは,混合「正規分布」モデルだから,混合ベルヌーイ分布(?)とかは無理なのよね…(俺は観測変数が連続だったら混合分布モデルといって観測変数がカテゴリカルだった…

問題の一部実施で妥当性の検証?

たまたま手元に40人,48問の反応のデータがある。 この状態で信頼性係数(α)は.85というくらい。 ここから,仮に(a)5問,(b)10問,(c)20問,(d)40問というように問題をランダムに抽出して信頼性係数を求めるという計算を,それぞれ100回ずつおこな…

Cronbachのα係数の信頼区間

Cronbachのα係数の信頼区間って,あんま考えないのだけど,Rではいろんな関数でだしてくれる。で,気づいたんだけど,パッケージごとで値が違う。そりゃそうだ,これ,っていう式がないだろうな。ブートストラップもできるし。 いろんな論文があるらしい。 F…

k層の2×2集計表メモ

勉強のメモ。メモしないと忘れちゃうもんな。 k層の2×2の分析をしなくちゃいけなくて,いろんな本を探したんだけど,これが一番よかった。 カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1) 作者: 藤井良宜,金明哲 出版社/メーカー: 共立出版 発売日: 20…

Rで並び替え検定:"coin"パッケージ

そうだそうだ,並び替え検定(permutation test)をRでやるには,て話があって。 仕組み自体簡単なので,Rだと簡単に関数が書ける。 たとえば, Permutation Test これとか。 でも,いっそのこと,"coin"パッケージを使えばいいかも。 CRAN - Package coin o…

解釈しやすい効果量「優越率」(続き)

前回の続き。 &amp;amp;amp;lt;a href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421" data-mce-href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421"&amp;amp;amp;gt;南風原・芝(1987) 優越率 - 草薙の研究ログ&amp;amp;amp;lt;/a&a…

解釈しやすい効果量「優越率」(南風原・芝, 1987)

南風原朝和・芝祐順(1987)「相関係数及び平均値差の解釈のための確率的な指標」『教育心理学研究』37, 259-267. で,提案されている(標準化)効果量指標のひとつ,「優越率」(probability of dominance)について,南風原(2014)でも紹介されている。標…

効果量・信頼区間の大げさな解釈または単純に変なことを言わない態度

「効果量がよい」と聞きかじれば,標本効果量をさも母効果量かのように扱って,いきりたって報告し,さらに取りうるだろう効果量の大きさに対して,完全に不適切に設定された標本サイズ下における検定を自らおこなって,そしてその検定のinsignificanceを無…

ステップワイズ多次元尺度構成法もどき

【背景】 多変数の相関関係を効率的に可視化するため(古典的)多次元尺度構成法(MDS)をするときがある。因子分析などをする前に見てみたりするとよい場合も多い。 多変数の相関関係といったらこちらの記事も。 多変数の相関を可視化する方法メモ - 草薙の…

コクラン・マンテル・ヘンツェル法

多層の2×2集計表の検定。 層化要因の調整とかが便利。 ちょうどこれをやることがあって,Rを探した。 あった。 便利だなー。 R: Cochran-Mantel-Haenszel Chi-Squared Test for Count Data

【教材用】Rで標準正規分布を描く

背景 たくさんあるけど,探すのが面倒なので自分のブログに張っちゃえ。 『生活と統計』という授業を持っていて,何かにつけて標準正規分布を描く機会があるんだけど,いつもちょっと面倒だな,って思ってしまう。いや,実は面倒だな,って思うわけでもない…

Rでロバスト相関:"robust"パッケージ

背景 相関係数のお話で,外れ値の影響を除きたいっていうときはいっぱいある。 方法もいっぱい。 まあ,ジャックナイフしてみるとか。 ジャックナイフはやろうと思ったらエクセルでもできるよん。 TIPS - 草薙邦広のページ でも今日はロバスト推定値をもとめ…

直交表実験計画→ロジスティック回帰

はじめに 直交表実験計画→ロジスティック回帰の流れは経済学というかマーケティングとかで,コンジョイント分析っていうので使うのよね。 自分の研究でもこれをやる機会が来た。 文法性判断課題(GJT)の分析で,もう古典的テスト理論ではなくて,つまり被験…

Rで項目反応理論:ltmパッケージ覚書き

背景 すっげえ便利。びっくらこいた。 ちょっと色々IRTでやんなきゃいけない事案があって(博論?),テストの等価とかやんなきゃいけなくて。 ltmパッケージっていうのがある。素晴らしい。 http://cran.r-project.org/web/packages/ltm/ltm.pdf その前に …

Rとエクセルで信号検出理論:"psyphy"パッケージ,簡単なRの関数,エクセルシート

信号検出理論(Signal Detection Theory)っていうのがあって。 普通,被験者の正答率(cf. 古典的テスト理論)というデータを扱うんだけど,信号検出理論では,検出力(弁別力,敏感さ,etc.; ungrammaticalityやanomaliesなどに対する)と判断基準(被験者…

テトラコリック相関係数と文法性判断課題のデータ

最初に ポリコリック相関係数は順序尺度(3件など)に「適応するとよいといわれる」相関係数の一種。 ポリシリアル相関係数は順序尺度と連続尺度。 テトラコリック相関係数はポリコリック相関係数の一種で,2値データによるもの。 これらは中に分布を仮定し…

因子分析で任意の項目を落としたときのモデルのあてはまり

ステップワイズ探索的因子分析(SEFA)のウェブサイトが最近動かないらしい(2014年7月現在)。 ちょっと似たようなことをしようと思って。相変わらず雑なやり方だけど。 もうRでジャックナイフみたいに全部項目の数だけ因子分析しちゃう。 使うのは,psychパッケ…

多変数の相関を可視化する方法メモ

自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつ…

二変量の時系列推移を散布図アニメーションで表す

例えば,相関関係が時系列でどのように変化していくか。 係数をプロットしてもいいんだけど,なんか散布図をアニメーションみたいに見せたい。でも手動だと大変。 散布図を繰り返し書いて保存するとか。 例えば, animeplot<-function(){ for (i in 1:10){ n…

偏相関・無向グラフメモ

偏相関係数にもとづいて無向グラフを手っ取り早く描く方法。 使うパッケージ corpcor qgraph library(corpcor) library(qgraph) dat=read.table("clipboard") #読み込み,データフレーム形式 cor(dat) #相関係数行列の算出 cor2pcor(cor(dat)) #(相関係数行…

正規表現を使った簡単な整形:SEFAの変数名を題材に

背景 SEFAっていうのがあって。 ステップワイズ探索的因子分析っていうの。 ウェブブラウザー上で因子分析ができる。 Stepwise Variable Selection in Exploratory Factor Analysis (SEFA) Ver. Beta-2.1 これをちょっとやることがあって。 これ,変数名入力…

相関係数行列の対角線から見て右上を落とす

背景 問い合わせが結構あって。 聞くところによると,例えばSPSS(触ったことない)とかエクセルの分析ツールを用いて相関係数行列を出すと,対角線から見て右上にも出力されて,それが面倒だとか。例えば, こんな感じ。 コレぐらいだったら手でやればいい…

偏相関係数行列

パス解析はよく見るのに,偏相関係数行列によるグラフィカルモデリングは外国語教育研究であまりみないし,報告しているのもあまりみない。 計算はすごく簡単なのに。 R -- 偏相関係数 psychのpartial.r関数でもいいね。 http://cran.r-project.org/web/pack…