外国語教育で極値統計・VaR・期待ショートフォール：自分用メモ

r 情報処理統計

極値統計極値分布：最小値や最大値が（漸近的に）従う分布。リスク管理などで使われる。一般極値分布（generalized extreme value distribution, GEV）は，3つのパラミターをもつ。位置パラミタースケールパラミター形状パラミター形状パラミターの値…

2015-05-27

幾何分布関係メモ：Rで乱数発生，最尤推定，負の二項回帰

r 情報処理教育統計

幾何分布ってなに幾何分布（geometric distribution）は，離散分布のひとつ。表になるまでコイン投げを繰り返すとして，はじめて表になった回数（または，表になるまでにかかった施行回数）などにあてはまる。もちろん，無記憶だということで，各回の施行…

2015-05-26

分布の裾あれこれ：Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

統計教育 r

キーワード分布の歪み，高次積率，モーメント，尖度，歪度，テールリスク，ファットテール，VaR，期待ショートフォール，フライシュマンのべき乗変換，コーニッシュ・フィッシャー展開，Rスクリプト背景：歪度と尖度ってなに一般に外国語教育の研究者は，…

2015-04-06

論文で報告されていない相関係数をサルベージ！（Rの関数つき）

情報処理 r 統計

背景対応のあるデータの論文で，あるある。平均値と標準偏差のペアが報告されている，よしよし。対応のあるt検定の検定統計量が報告されている，ふむふむ。でも相関係数や分散共分散行列が報告されていない！なんでだよー。。。たとえば，標準化効果量…

2015-04-03

「カタチ」で見る集団に対する処遇の結果

情報処理 r 統計教育

はじめに集団に対する処遇の結果に関するデータを「可視化」して，目でみて把握しましょうというはなし。データの可視化を…？たとえば，多読の授業をやって，事前と事後でテストの成績を比較するとする。もちろん，こういうふうに可視化してもよい。で…

2015-04-02

実践報告やアクションリサーチにおいて統計分析は必要ない？

教育統計

前までのシリーズはちょっとおやすみ。ちょっと，ここで気になる話について書いてみる。実践報告よく，日本の外国語教育に関わる諸学会では，実践報告という枠が発表や論文に対してあって，そこでは，実際におこなっている指導内容などについて報告するこ…

2015-03-20

効果量では見えない指導の効果（8）：外国語教育での実例（事前ー事後）

r 情報処理教育統計

さてさて。今回は繰り返しあるの比較。事前ー事後ね。事前ー事後の比較対象とする論文は，前田啓朗（2008）「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. <a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

2015-03-19

効果量では見えない指導の効果（7）：外国語教育での実例（実験群―統制群）

統計 r 教育

今回は，実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合（NEGD，処置後における統制群と実験群の成績の比較）と対応ありの場合（NEGD，実験群の事前―事後の比較）。今回は前者。統制群と実験群の比較例とする論文は， Sh…

2015-03-18

効果量では見えない指導の効果（6）：分位点回帰

情報処理 r 教育統計

1. これまでのおさらい前回は，事前－事後の成績の比較について，（1）効果量には，相関を考慮するものと，しないものがある（2）いずれにせよ，事前－事後の比較では，平均差，標準偏差だけではなく，相関係数（r）や分散比（F）が重要になる場合もある …

2015-03-13

効果量では見えない指導の効果（5）：繰り返しのデータ

r 教育統計

1. 事前と事後の間の比較これまでは統制群と実験群の比較についてみたけど，これからは事前と事後の間。もちろん，繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分，意思決定ができる場合もあるだろうけど，ちょっともっと他の情報…

2015-03-12

効果量では見えない指導の効果（4）：データの歪みと分布の情報

r 統計教育

1. 歪んだデータで効果の検証？わたしが申しあげるまでもなく，外国語教育のデータはきたない。もちろんテーマなどによるけど。たとえば，もし仮にこんなデータがあったとしよう（よくありそう）。黒が統制群，赤が実験群で，postテストの成績だとしてみ…

2015-03-10

効果量では見えない指導の効果（3）：目標規準準拠のとき

教育統計

1. 集団基準準拠と目標規準準拠の差第二言語習得研究や，外国語教育研究のうちの，一部のアカデミック寄りな観点では，第二言語なり外国語の熟達度に関する構成概念を対象として測定をおこなうことが多い。ほとんどの構成概念は，熟達度になんらかの影響を…

2015-03-09

効果量では見えない指導の効果（2）：解釈のための工夫

教育統計情報処理

背景自分のメモのためにも続き。前回は：効果量では見えない指導の効果（1） - 草薙の研究ログ効果量では見えない指導の効果（1） - 草薙の研究ログさて，前回では，（1）外国語教育の実務的観点では，学習・指導の効果を効果量のみで議論することはそ…

2015-03-06

効果量では見えない指導の効果

r 統計教育

実務上，効果量がさっぱりわからない件効果量は集団に対してあるものなので，効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が（ある程度の精度や確証をもって）観測できるか」どうかという理論実証…

2015-02-28

NEDV（nonequivalent dependent variables design）のススメ

統計教育

なにかの指導法の効果をみるとき，われわれはふつう無作為標本化はできないので，準実験計画，なかでも異なるグループ間で事前事後などをくらべるデザイン，NEGD（the nonequivalent group design）というのをやる。非等集団計画とかいう？こんな感じのおな…

2015-02-17

連続変数とカテゴリカル変数が混ざった潜在クラス分析

統計 r

潜在クラス分析をRでやるpoLCAは名にし負わばでpoだし，混合分布モデルのmclustパッケージは，混合「正規分布」モデルだから，混合ベルヌーイ分布（？）とかは無理なのよね…（俺は観測変数が連続だったら混合分布モデルといって観測変数がカテゴリカルだった…

2015-02-16

問題の一部実施で妥当性の検証？

情報処理統計 r

たまたま手元に40人，48問の反応のデータがある。この状態で信頼性係数（α）は.85というくらい。ここから，仮に（a）5問，（b）10問，（c）20問，（d）40問というように問題をランダムに抽出して信頼性係数を求めるという計算を，それぞれ100回ずつおこな…

2015-02-04

Cronbachのα係数の信頼区間

r 統計

Cronbachのα係数の信頼区間って，あんま考えないのだけど，Rではいろんな関数でだしてくれる。で，気づいたんだけど，パッケージごとで値が違う。そりゃそうだ，これ，っていう式がないだろうな。ブートストラップもできるし。いろんな論文があるらしい。 F…

2015-01-29

k層の2×2集計表メモ

r 統計

勉強のメモ。メモしないと忘れちゃうもんな。 k層の2×2の分析をしなくちゃいけなくて，いろんな本を探したんだけど，これが一番よかった。カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1) 作者: 藤井良宜,金明哲出版社/メーカー: 共立出版発売日: 20…

2015-01-28

Rで並び替え検定："coin"パッケージ

r 統計情報処理

そうだそうだ，並び替え検定（permutation test）をRでやるには，て話があって。仕組み自体簡単なので，Rだと簡単に関数が書ける。たとえば， Permutation Test これとか。でも，いっそのこと，"coin"パッケージを使えばいいかも。 CRAN - Package coin o…

2015-01-28

解釈しやすい効果量「優越率」（続き）

r 統計情報処理

前回の続き。 &amp;amp;lt;a href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421" data-mce-href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421"&amp;amp;gt;南風原・芝（1987）優越率 - 草薙の研究ログ&amp;amp;lt;/a&a…

2015-01-23

解釈しやすい効果量「優越率」（南風原・芝, 1987）

r 統計

南風原朝和・芝祐順（1987）「相関係数及び平均値差の解釈のための確率的な指標」『教育心理学研究』37, 259-267. で，提案されている（標準化）効果量指標のひとつ，「優越率」（probability of dominance）について，南風原（2014）でも紹介されている。標…

2015-01-23

効果量・信頼区間の大げさな解釈または単純に変なことを言わない態度

r 統計

「効果量がよい」と聞きかじれば，標本効果量をさも母効果量かのように扱って，いきりたって報告し，さらに取りうるだろう効果量の大きさに対して，完全に不適切に設定された標本サイズ下における検定を自らおこなって，そしてその検定のinsignificanceを無…

2015-01-22

ステップワイズ多次元尺度構成法もどき

r 統計

【背景】多変数の相関関係を効率的に可視化するため（古典的）多次元尺度構成法（MDS）をするときがある。因子分析などをする前に見てみたりするとよい場合も多い。多変数の相関関係といったらこちらの記事も。多変数の相関を可視化する方法メモ - 草薙の…

2015-01-07

コクラン・マンテル・ヘンツェル法

r 統計

多層の2×2集計表の検定。層化要因の調整とかが便利。ちょうどこれをやることがあって，Rを探した。あった。便利だなー。 R: Cochran-Mantel-Haenszel Chi-Squared Test for Count Data

2014-12-10

【教材用】Rで標準正規分布を描く

r 統計情報処理

背景たくさんあるけど，探すのが面倒なので自分のブログに張っちゃえ。『生活と統計』という授業を持っていて，何かにつけて標準正規分布を描く機会があるんだけど，いつもちょっと面倒だな，って思ってしまう。いや，実は面倒だな，って思うわけでもない…

2014-11-19

Rでロバスト相関："robust"パッケージ

r 統計情報処理

背景相関係数のお話で，外れ値の影響を除きたいっていうときはいっぱいある。方法もいっぱい。まあ，ジャックナイフしてみるとか。ジャックナイフはやろうと思ったらエクセルでもできるよん。 TIPS - 草薙邦広のページでも今日はロバスト推定値をもとめ…

2014-11-13

直交表実験計画→ロジスティック回帰

r 統計情報処理

はじめに直交表実験計画→ロジスティック回帰の流れは経済学というかマーケティングとかで，コンジョイント分析っていうので使うのよね。自分の研究でもこれをやる機会が来た。文法性判断課題（GJT）の分析で，もう古典的テスト理論ではなくて，つまり被験…

2014-11-06

Rで項目反応理論：ltmパッケージ覚書き

r 情報処理統計

背景すっげえ便利。びっくらこいた。ちょっと色々IRTでやんなきゃいけない事案があって（博論？），テストの等価とかやんなきゃいけなくて。 ltmパッケージっていうのがある。素晴らしい。 http://cran.r-project.org/web/packages/ltm/ltm.pdf その前に …

2014-11-01

Rとエクセルで信号検出理論："psyphy"パッケージ，簡単なRの関数，エクセルシート

r 統計

信号検出理論（Signal Detection Theory）っていうのがあって。普通，被験者の正答率（cf. 古典的テスト理論）というデータを扱うんだけど，信号検出理論では，検出力（弁別力，敏感さ，etc.; ungrammaticalityやanomaliesなどに対する）と判断基準（被験者…