草薙の研究ログ

英語の先生をやってます。

r

どう見ても違うものを同じという怖さ

どう見ても違う 直球でいこう。こういうこと。 てい! 効果量の値は同じ!でもどうみてもぜんぜん違う! 情報の集約あれこれ雑感 最近よく, みたいな表を見るようになった。*1 情報の集約として,別に悪いとは思わない。*2 集約の程度が大きい,ということ…

カーネル密度推定からその後:ksパッケージ

背景 正規分布を逸脱したデータの累積分布曲線を描きたい。 たとえば,こんなデータってことにしよう。 このデータは, c(rnorm(100.-5,1),rnorm(100,5,1))->dat こうやってつくろう。 Nが200もあれば,quantile関数で, で,こんな感じにできる。 でもこれ…

項目関連構造分析(item relational structure analysis)メモ

項目関連構造分析(item relational structure analysis)っていうのがあって,すごくアルゴリズムが簡単みたいなので,教育現場でも使えればいいとおもう。でも簡単に使えそうな道具がない。Excelでもできるのだけど… すぐ見れそうな関連論文は… CiNii 論文…

部分積率(partial moment)を使った教育的処遇の効果検証

背景:教育的処遇の効果をみるさまざまな方法 (某先生を真似して会話形式で) 教師:ちょっと工夫した指導をして,事前事後のデータとったった。 平均差を見る専門家:おお!10点平均点が伸びてる!これは効果的な指導法だ! 統計的仮説検定をする専門家:…

クロス集計をあえて散布図みたいに可視化する:Rの関数つき

背景 たいていの質問紙の項目に対する回答は,離散的な値を取る。 1, 2, 3, 4, 5みたいな。リッカート尺度みたいな場合ね。 ここである質問項目iの回答と質問項目jの回答をみたい。 5件とか7件のリッカート尺度だと,(ピアソンの)相関係数を出したりするこ…

外国語教育で極値統計・VaR・期待ショートフォール:自分用メモ

極値統計 極値分布:最小値や最大値が(漸近的に)従う分布。リスク管理などで使われる。 一般極値分布(generalized extreme value distribution, GEV)は,3つのパラミターをもつ。 位置パラミター スケールパラミター 形状パラミター 形状パラミターの値…

幾何分布関係メモ:Rで乱数発生,最尤推定,負の二項回帰

幾何分布ってなに 幾何分布(geometric distribution)は,離散分布のひとつ。 表になるまでコイン投げを繰り返すとして,はじめて表になった回数(または,表になるまでにかかった施行回数)などにあてはまる。もちろん,無記憶だということで,各回の施行…

分布の裾あれこれ:Rでフライシュマンのべき乗変換・コーニッシュ・フィッシャー展開

キーワード 分布の歪み,高次積率,モーメント,尖度,歪度,テールリスク,ファットテール,VaR,期待ショートフォール,フライシュマンのべき乗変換,コーニッシュ・フィッシャー展開,Rスクリプト 背景:歪度と尖度ってなに 一般に外国語教育の研究者は,…

論文で報告されていない相関係数をサルベージ!(Rの関数つき)

背景 対応のあるデータの論文で,あるある。 平均値と標準偏差のペアが報告されている,よしよし。 対応のあるt検定の検定統計量が報告されている,ふむふむ。 でも相関係数や分散共分散行列が報告されていない!なんでだよー。。。 たとえば,標準化効果量…

「カタチ」で見る集団に対する処遇の結果

はじめに 集団に対する処遇の結果に関するデータを「可視化」して,目でみて把握しましょうというはなし。 データの可視化を…? たとえば,多読の授業をやって,事前と事後でテストの成績を比較するとする。 もちろん,こういうふうに可視化してもよい。 で…

効果量では見えない指導の効果(8):外国語教育での実例(事前ー事後)

さてさて。今回は繰り返しあるの比較。事前ー事後ね。 事前ー事後の比較 対象とする論文は, 前田啓朗(2008)「WBTを援用した授業で成功した学習者・成功しなかった学習者」ARELE, 19, 253-262. <a href="http://ci.nii.ac.jp/naid/110008512362" data-m…

効果量では見えない指導の効果(7):外国語教育での実例(実験群―統制群)

今回は,実際の外国語教育研究での例をあげて考えてみる。 2種類ある。繰り返しなしの場合(NEGD,処置後における統制群と実験群の成績の比較)と対応ありの場合(NEGD,実験群の事前―事後の比較)。 今回は前者。 統制群と実験群の比較 例とする論文は, Sh…

効果量では見えない指導の効果(6):分位点回帰

1. これまでのおさらい 前回は,事前-事後の成績の比較について, (1)効果量には,相関を考慮するものと,しないものがある (2)いずれにせよ,事前-事後の比較では,平均差,標準偏差だけではなく,相関係数(r)や分散比(F)が重要になる場合もある …

効果量では見えない指導の効果(5):繰り返しのデータ

1. 事前と事後の間の比較 これまでは統制群と実験群の比較についてみたけど,これからは事前と事後の間。 もちろん,繰り返しのデータのときも基本はこれまでの一緒の考えかた。効果量で十分,意思決定ができる場合もあるだろうけど,ちょっともっと他の情報…

効果量では見えない指導の効果(4):データの歪みと分布の情報

1. 歪んだデータで効果の検証? わたしが申しあげるまでもなく,外国語教育のデータはきたない。もちろんテーマなどによるけど。 たとえば,もし仮にこんなデータがあったとしよう(よくありそう)。 黒が統制群,赤が実験群で,postテストの成績だとしてみ…

効果量では見えない指導の効果

実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証…

連続変数とカテゴリカル変数が混ざった潜在クラス分析

潜在クラス分析をRでやるpoLCAは名にし負わばでpoだし,混合分布モデルのmclustパッケージは,混合「正規分布」モデルだから,混合ベルヌーイ分布(?)とかは無理なのよね…(俺は観測変数が連続だったら混合分布モデルといって観測変数がカテゴリカルだった…

問題の一部実施で妥当性の検証?

たまたま手元に40人,48問の反応のデータがある。 この状態で信頼性係数(α)は.85というくらい。 ここから,仮に(a)5問,(b)10問,(c)20問,(d)40問というように問題をランダムに抽出して信頼性係数を求めるという計算を,それぞれ100回ずつおこな…

Cronbachのα係数の信頼区間

Cronbachのα係数の信頼区間って,あんま考えないのだけど,Rではいろんな関数でだしてくれる。で,気づいたんだけど,パッケージごとで値が違う。そりゃそうだ,これ,っていう式がないだろうな。ブートストラップもできるし。 いろんな論文があるらしい。 F…

k層の2×2集計表メモ

勉強のメモ。メモしないと忘れちゃうもんな。 k層の2×2の分析をしなくちゃいけなくて,いろんな本を探したんだけど,これが一番よかった。 カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1) 作者: 藤井良宜,金明哲 出版社/メーカー: 共立出版 発売日: 20…

Rで並び替え検定:"coin"パッケージ

そうだそうだ,並び替え検定(permutation test)をRでやるには,て話があって。 仕組み自体簡単なので,Rだと簡単に関数が書ける。 たとえば, Permutation Test これとか。 でも,いっそのこと,"coin"パッケージを使えばいいかも。 CRAN - Package coin o…

解釈しやすい効果量「優越率」(続き)

前回の続き。 <a href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421" data-mce-href="http://kusanagi.hatenablog.jp/entry/2015/01/23/173421">南風原・芝(1987) 優越率 - 草薙の研究ログ</a&a…

解釈しやすい効果量「優越率」(南風原・芝, 1987)

南風原朝和・芝祐順(1987)「相関係数及び平均値差の解釈のための確率的な指標」『教育心理学研究』37, 259-267. で,提案されている(標準化)効果量指標のひとつ,「優越率」(probability of dominance)について,南風原(2014)でも紹介されている。標…

効果量・信頼区間の大げさな解釈または単純に変なことを言わない態度

「効果量がよい」と聞きかじれば,標本効果量をさも母効果量かのように扱って,いきりたって報告し,さらに取りうるだろう効果量の大きさに対して,完全に不適切に設定された標本サイズ下における検定を自らおこなって,そしてその検定のinsignificanceを無…

ステップワイズ多次元尺度構成法もどき

【背景】 多変数の相関関係を効率的に可視化するため(古典的)多次元尺度構成法(MDS)をするときがある。因子分析などをする前に見てみたりするとよい場合も多い。 多変数の相関関係といったらこちらの記事も。 多変数の相関を可視化する方法メモ - 草薙の…

コクラン・マンテル・ヘンツェル法

多層の2×2集計表の検定。 層化要因の調整とかが便利。 ちょうどこれをやることがあって,Rを探した。 あった。 便利だなー。 R: Cochran-Mantel-Haenszel Chi-Squared Test for Count Data

【教材用】Rで標準正規分布を描く

背景 たくさんあるけど,探すのが面倒なので自分のブログに張っちゃえ。 『生活と統計』という授業を持っていて,何かにつけて標準正規分布を描く機会があるんだけど,いつもちょっと面倒だな,って思ってしまう。いや,実は面倒だな,って思うわけでもない…

Rでロバスト相関:"robust"パッケージ

背景 相関係数のお話で,外れ値の影響を除きたいっていうときはいっぱいある。 方法もいっぱい。 まあ,ジャックナイフしてみるとか。 ジャックナイフはやろうと思ったらエクセルでもできるよん。 TIPS - 草薙邦広のページ でも今日はロバスト推定値をもとめ…

直交表実験計画→ロジスティック回帰

はじめに 直交表実験計画→ロジスティック回帰の流れは経済学というかマーケティングとかで,コンジョイント分析っていうので使うのよね。 自分の研究でもこれをやる機会が来た。 文法性判断課題(GJT)の分析で,もう古典的テスト理論ではなくて,つまり被験…

Rで項目反応理論:ltmパッケージ覚書き

背景 すっげえ便利。びっくらこいた。 ちょっと色々IRTでやんなきゃいけない事案があって(博論?),テストの等価とかやんなきゃいけなくて。 ltmパッケージっていうのがある。素晴らしい。 http://cran.r-project.org/web/packages/ltm/ltm.pdf その前に …