統計
極値統計 極値分布:最小値や最大値が(漸近的に)従う分布。リスク管理などで使われる。 一般極値分布(generalized extreme value distribution, GEV)は,3つのパラミターをもつ。 位置パラミター スケールパラミター 形状パラミター 形状パラミターの値…
幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…
キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…
背景 対応のあるデータの論文で,あるある。 平均値と標準偏差のペアが報告されている,よしよし。 対応のあるt検定の検定統計量が報告されている,ふむふむ。 でも相関係数や分散共分散行列が報告されていない!なんでだよー。。。 たとえば,標準化効果量…
はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…
前までのシリーズはちょっとおやすみ。 ちょっと,ここで気になる話について書いてみる。 実践報告 よく,日本の外国語教育に関わる諸学会では,実践報告という枠が発表や論文に対してあって,そこでは,実際におこなっている指導内容などについて報告するこ…
さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. <a href="http://ci.nii.ac.jp/naid/110008512362" data-m…
今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…
1. これまでのおさらい 前回は,事前-事後の成績の比較について, (1)効果量には,相関を考慮するものと,しないものがある (2)いずれにせよ,事前-事後の比較では,平均差,標準偏差だけではなく,相関係数(r)や分散比(F)が重要になる場合もある …
1. 事前と事後の間の比較 これまでは統制群と実験群の比較についてみたけど,これからは事前と事後の間。 もちろん,繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分,意思決定ができる場合もあるだろうけど,ちょっともっと他の情報…
1. 歪んだデータで効果の検証? わたしが申しあげるまでもなく,外国語教育のデータはきたない。もちろんテーマなどによるけど。 たとえば,もし仮にこんなデータがあったとしよう(よくありそう)。 黒が統制群,赤が実験群で,postテストの成績だとしてみ…
1. 集団基準準拠と目標規準準拠の差 第二言語習得研究や,外国語教育研究のうちの,一部のアカデミック寄りな観点では,第二言語なり外国語の熟達度に関する構成概念を対象として測定をおこなうことが多い。ほとんどの構成概念は,熟達度になんらかの影響を…
背景 自分のメモのためにも続き。 前回は: 効果量では見えない指導の効果(1) - 草薙の研究ログ 効果量では見えない指導の効果(1) - 草薙の研究ログ さて,前回では, (1)外国語教育の実務的観点では,学習・指導の効果を効果量のみで議論することはそ…
実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証…
なにかの指導法の効果をみるとき,われわれはふつう無作為標本化はできないので,準実験計画,なかでも異なるグループ間で事前事後などをくらべるデザイン,NEGD(the nonequivalent group design)というのをやる。非等集団計画とかいう?こんな感じのおな…
潜在クラス分析をRでやるpoLCAは名にし負わばでpoだし,混合分布モデルのmclustパッケージは,混合「正規分布」モデルだから,混合ベルヌーイ分布(?)とかは無理なのよね…(俺は観測変数が連続だったら混合分布モデルといって観測変数がカテゴリカルだった…
たまたま手元に40人,48問の反応のデータがある。 この状態で信頼性係数(α)は.85というくらい。 ここから,仮に(a)5問,(b)10問,(c)20問,(d)40問というように問題をランダムに抽出して信頼性係数を求めるという計算を,それぞれ100回ずつおこな…
Cronbachのα係数の信頼区間って,あんま考えないのだけど,Rではいろんな関数でだしてくれる。で,気づいたんだけど,パッケージごとで値が違う。そりゃそうだ,これ,っていう式がないだろうな。ブートストラップもできるし。 いろんな論文があるらしい。 F…
勉強のメモ。メモしないと忘れちゃうもんな。 k層の2×2の分析をしなくちゃいけなくて,いろんな本を探したんだけど,これが一番よかった。 カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1) 作者: 藤井良宜,金明哲 出版社/メーカー: 共立出版 発売日: 20…
そうだそうだ,並び替え検定(permutation test)をRでやるには,て話があって。 仕組み自体簡単なので,Rだと簡単に関数が書ける。 たとえば, Permutation Test これとか。 でも,いっそのこと,"coin"パッケージを使えばいいかも。 CRAN - Package coin o…
前回の続き。 &amp;amp;lt;a href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421" data-mce-href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421"&amp;amp;gt;南風原・芝(1987) 優越率 - 草薙の研究ログ&amp;amp;lt;/a&a…
南風原朝和・芝祐順(1987)「相関係数及び平均値差の解釈のための確率的な指標」『教育心理学研究』37, 259-267. で,提案されている(標準化)効果量指標のひとつ,「優越率」(probability of dominance)について,南風原(2014)でも紹介されている。標…
「効果量がよい」と聞きかじれば,標本効果量をさも母効果量かのように扱って,いきりたって報告し,さらに取りうるだろう効果量の大きさに対して,完全に不適切に設定された標本サイズ下における検定を自らおこなって,そしてその検定のinsignificanceを無…
【背景】 多変数の相関関係を効率的に可視化するため(古典的)多次元尺度構成法(MDS)をするときがある。因子分析などをする前に見てみたりするとよい場合も多い。 多変数の相関関係といったらこちらの記事も。 多変数の相関を可視化する方法メモ - 草薙の…
多層の2×2集計表の検定。 層化要因の調整とかが便利。 ちょうどこれをやることがあって,Rを探した。 あった。 便利だなー。 R: Cochran-Mantel-Haenszel Chi-Squared Test for Count Data
背景 たくさんあるけど,探すのが面倒なので自分のブログに張っちゃえ。 『生活と統計』という授業を持っていて,何かにつけて標準正規分布を描く機会があるんだけど,いつもちょっと面倒だな,って思ってしまう。いや,実は面倒だな,って思うわけでもない…
背景 相関係数のお話で,外れ値の影響を除きたいっていうときはいっぱいある。 方法もいっぱい。 まあ,ジャックナイフしてみるとか。 ジャックナイフはやろうと思ったらエクセルでもできるよん。 TIPS - 草薙邦広のページ でも今日はロバスト推定値をもとめ…
はじめに 直交表実験計画→ロジスティック回帰の流れは経済学というかマーケティングとかで,コンジョイント分析っていうので使うのよね。 自分の研究でもこれをやる機会が来た。 文法性判断課題(GJT)の分析で,もう古典的テスト理論ではなくて,つまり被験…
背景 すっげえ便利。びっくらこいた。 ちょっと色々IRTでやんなきゃいけない事案があって(博論?),テストの等価とかやんなきゃいけなくて。 ltmパッケージっていうのがある。素晴らしい。 http://cran.r-project.org/web/packages/ltm/ltm.pdf その前に …
信号検出理論(Signal Detection Theory)っていうのがあって。 普通,被験者の正答率(cf. 古典的テスト理論)というデータを扱うんだけど,信号検出理論では,検出力(弁別力,敏感さ,etc.; ungrammaticalityやanomaliesなどに対する)と判断基準(被験者…