草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

r

外国語教育で極値統計・VaR・期待ショートフォール:自分用メモ

極値統計 極値分布:最小値や最大値が(漸近的に)従う分布。リスク管理などで使われる。 一般極値分布(generalized extreme value distribution, GEV)は,3つのパラミターをもつ。 位置パラミター スケールパラミター 形状パラミター 形状パラミターの値…

幾何分布関係メモ:Rで乱数発生,最尤推定,負の二項回帰

幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…

分布の裾あれこれ:Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…

論文で報告されていない相関係数をサルベージ!(Rの関数つき)

背景 対応のあるデータの論文で,あるある。 平均値と標準偏差のペアが報告されている,よしよし。 対応のあるt検定の検定統計量が報告されている,ふむふむ。 でも相関係数や分散共分散行列が報告されていない!なんでだよー。。。 たとえば,標準化効果量…

「カタチ」で見る集団に対する処遇の結果

はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…

効果量では見えない指導の効果(8):外国語教育での実例(事前ー事後)

さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. <a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

効果量では見えない指導の効果(7):外国語教育での実例(実験群―統制群)

今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…

効果量では見えない指導の効果(6):分位点回帰

1. これまでのおさらい 前回は,事前-事後の成績の比較について, (1)効果量には,相関を考慮するものと,しないものがある (2)いずれにせよ,事前-事後の比較では,平均差,標準偏差だけではなく,相関係数(r)や分散比(F)が重要になる場合もある …

効果量では見えない指導の効果(5):繰り返しのデータ

1. 事前と事後の間の比較 これまでは統制群と実験群の比較についてみたけど,これからは事前と事後の間。 もちろん,繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分,意思決定ができる場合もあるだろうけど,ちょっともっと他の情報…

効果量では見えない指導の効果(4):データの歪みと分布の情報

1. 歪んだデータで効果の検証? わたしが申しあげるまでもなく,外国語教育のデータはきたない。もちろんテーマなどによるけど。 たとえば,もし仮にこんなデータがあったとしよう(よくありそう)。 黒が統制群,赤が実験群で,postテストの成績だとしてみ…

効果量では見えない指導の効果

実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証…

連続変数とカテゴリカル変数が混ざった潜在クラス分析

潜在クラス分析をRでやるpoLCAは名にし負わばでpoだし,混合分布モデルのmclustパッケージは,混合「正規分布」モデルだから,混合ベルヌーイ分布(?)とかは無理なのよね…(俺は観測変数が連続だったら混合分布モデルといって観測変数がカテゴリカルだった…

問題の一部実施で妥当性の検証?

たまたま手元に40人,48問の反応のデータがある。 この状態で信頼性係数(α)は.85というくらい。 ここから,仮に(a)5問,(b)10問,(c)20問,(d)40問というように問題をランダムに抽出して信頼性係数を求めるという計算を,それぞれ100回ずつおこな…

Cronbachのα係数の信頼区間

Cronbachのα係数の信頼区間って,あんま考えないのだけど,Rではいろんな関数でだしてくれる。で,気づいたんだけど,パッケージごとで値が違う。そりゃそうだ,これ,っていう式がないだろうな。ブートストラップもできるし。 いろんな論文があるらしい。 F…

k層の2×2集計表メモ

勉強のメモ。メモしないと忘れちゃうもんな。 k層の2×2の分析をしなくちゃいけなくて,いろんな本を探したんだけど,これが一番よかった。 カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1) 作者: 藤井良宜,金明哲 出版社/メーカー: 共立出版 発売日: 20…

Rで並び替え検定:"coin"パッケージ

そうだそうだ,並び替え検定(permutation test)をRでやるには,て話があって。 仕組み自体簡単なので,Rだと簡単に関数が書ける。 たとえば, Permutation Test これとか。 でも,いっそのこと,"coin"パッケージを使えばいいかも。 CRAN - Package coin o…

解釈しやすい効果量「優越率」(続き)

前回の続き。 <a href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421" data-mce-href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421">南風原・芝(1987) 優越率 - 草薙の研究ログ</a&a…

解釈しやすい効果量「優越率」(南風原・芝, 1987)

南風原朝和・芝祐順(1987)「相関係数及び平均値差の解釈のための確率的な指標」『教育心理学研究』37, 259-267. で,提案されている(標準化)効果量指標のひとつ,「優越率」(probability of dominance)について,南風原(2014)でも紹介されている。標…

効果量・信頼区間の大げさな解釈または単純に変なことを言わない態度

「効果量がよい」と聞きかじれば,標本効果量をさも母効果量かのように扱って,いきりたって報告し,さらに取りうるだろう効果量の大きさに対して,完全に不適切に設定された標本サイズ下における検定を自らおこなって,そしてその検定のinsignificanceを無…

ステップワイズ多次元尺度構成法もどき

【背景】 多変数の相関関係を効率的に可視化するため(古典的)多次元尺度構成法(MDS)をするときがある。因子分析などをする前に見てみたりするとよい場合も多い。 多変数の相関関係といったらこちらの記事も。 多変数の相関を可視化する方法メモ - 草薙の…

コクラン・マンテル・ヘンツェル法

多層の2×2集計表の検定。 層化要因の調整とかが便利。 ちょうどこれをやることがあって,Rを探した。 あった。 便利だなー。 R: Cochran-Mantel-Haenszel Chi-Squared Test for Count Data

【教材用】Rで標準正規分布を描く

背景 たくさんあるけど,探すのが面倒なので自分のブログに張っちゃえ。 『生活と統計』という授業を持っていて,何かにつけて標準正規分布を描く機会があるんだけど,いつもちょっと面倒だな,って思ってしまう。いや,実は面倒だな,って思うわけでもない…

Rでロバスト相関:"robust"パッケージ

背景 相関係数のお話で,外れ値の影響を除きたいっていうときはいっぱいある。 方法もいっぱい。 まあ,ジャックナイフしてみるとか。 ジャックナイフはやろうと思ったらエクセルでもできるよん。 TIPS - 草薙邦広のページ でも今日はロバスト推定値をもとめ…

直交表実験計画→ロジスティック回帰

はじめに 直交表実験計画→ロジスティック回帰の流れは経済学というかマーケティングとかで,コンジョイント分析っていうので使うのよね。 自分の研究でもこれをやる機会が来た。 文法性判断課題(GJT)の分析で,もう古典的テスト理論ではなくて,つまり被験…

Rで項目反応理論:ltmパッケージ覚書き

背景 すっげえ便利。びっくらこいた。 ちょっと色々IRTでやんなきゃいけない事案があって(博論?),テストの等価とかやんなきゃいけなくて。 ltmパッケージっていうのがある。素晴らしい。 http://cran.r-project.org/web/packages/ltm/ltm.pdf その前に …

Rとエクセルで信号検出理論:"psyphy"パッケージ,簡単なRの関数,エクセルシート

信号検出理論(Signal Detection Theory)っていうのがあって。 普通,被験者の正答率(cf. 古典的テスト理論)というデータを扱うんだけど,信号検出理論では,検出力(弁別力,敏感さ,etc.; ungrammaticalityやanomaliesなどに対する)と判断基準(被験者…

テトラコリック相関係数と文法性判断課題のデータ

最初に ポリコリック相関係数は順序尺度(3件など)に「適応するとよいといわれる」相関係数の一種。 ポリシリアル相関係数は順序尺度と連続尺度。 テトラコリック相関係数はポリコリック相関係数の一種で,2値データによるもの。 これらは中に分布を仮定し…

因子分析で任意の項目を落としたときのモデルのあてはまり

ステップワイズ探索的因子分析(SEFA)のウェブサイトが最近動かないらしい(2014年7月現在)。 ちょっと似たようなことをしようと思って。相変わらず雑なやり方だけど。 もうRでジャックナイフみたいに全部項目の数だけ因子分析しちゃう。 使うのは,psychパッケ…

多変数の相関を可視化する方法メモ

自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつ…

二変量の時系列推移を散布図アニメーションで表す

例えば,相関関係が時系列でどのように変化していくか。 係数をプロットしてもいいんだけど,なんか散布図をアニメーションみたいに見せたい。でも手動だと大変。 散布図を繰り返し書いて保存するとか。 例えば, animeplot<-function(){ for (i in 1:10){ n…

偏相関・無向グラフメモ

偏相関係数にもとづいて無向グラフを手っ取り早く描く方法。 使うパッケージ corpcor qgraph library(corpcor) library(qgraph) dat=read.table("clipboard") #読み込み,データフレーム形式 cor(dat) #相関係数行列の算出 cor2pcor(cor(dat)) #(相関係数行…

偏相関係数行列

パス解析はよく見るのに,偏相関係数行列によるグラフィカルモデリングは外国語教育研究であまりみないし,報告しているのもあまりみない。 計算はすごく簡単なのに。 R -- 偏相関係数 psychのpartial.r関数でもいいね。 http://cran.r-project.org/web/pack…

長い反応時間,ex-Gaussian分布と混合ガウス分布

乱数とか分布の当てはめの練習と備忘録に。 Rでmclustという混合ガウス分布関係のlibraryがある。 CRAN - Package mclust http://cran.r-project.org/web/packages/mclust/mclust.pdf mclust: an R package for normal mixture modeling 一方,ex-Gaussian分…