草薙の研究ログ

英語の先生をやってます。

統計

【サドコマ⑦】まったくわからない統計が査読に回ってきたwww【査読者の責任】

英語教育研究の査読で困った!サドコマシリーズ第7弾!シェアしてくださると嬉しいです! このシリーズについては↓ kusanagi.hatenablog.jp このシリーズは,統計処理のTIPSや入門というよりも,査読時における両サイドのコミュニケーションについて扱って…

【サドコマ⑥】事後分析の恐怖【偽陽性】

英語教育研究の査読で困った!サドコマシリーズ第6弾!シェアしてくださると嬉しいです!第6弾は英語教育研究における事後分析について私見を述べます。

【サドコマ⑤】それ正規分布しなくない?【尺度水準と分布】

英語教育研究の査読で困った!サドコマシリーズ第5弾!第5弾は予定の内容を差し替えて,英語教育研究における尺度水準の取り違えと分布の無視について私見を述べます。

【サドコマ④】有意差がなかったのに効果量が大きい?【効果量の誤解】

英語教育研究の査読で困った!サドコマシリーズ第4弾!とてもご好評いただいております!シェアしてくださると嬉しいです!! このシリーズについては↓ kusanagi.hatenablog.jp 第4弾では,英語教育研究における「効果量(effect size)に関わる誤解」につ…

【サドコマ③】検定めっちゃ繰り返してる…【検定の多重性】

英語教育研究の査読で困った!サドコマシリーズ第三弾!とてもご好評いただいております!シェアしてくださると嬉しいです! このシリーズについては↓ kusanagi.hatenablog.jp こんにちは,草薙です!第3弾では,英語教育研究において頻繁に見られる「検定…

【サドコマ②】どこにも有意差がなかった…【null results】

英語教育研究の査読で困った!サドコマシリーズ第二弾!早速ご好評いただいております! このシリーズについては↓ kusanagi.hatenablog.jp 第二弾では,英語教育研究において,「論文内のどこにも有意差がない,期待される結果が得られなかった論文(null re…

【サドコマ①】絶対に不可欠な統計の報告がなされてないんだけど?【報告不備】

英語教育研究の査読で困った!サドコマシリーズ第一弾! このシリーズについては↓ kusanagi.hatenablog.jp 第一弾では,「必要と考えられる統計に関する値が報告されていない」論文(報告不備,報告抜け,報告落ち)について私見を述べます。必要不可欠な統…

【サドコマ】英語教育の統計関係の査読で困ったときに

このシリーズについて 私の動機 英語教育研究の現状認識 個人的な動機といきさつ 取り上げるトピック 現在公開中の記事 このシリーズについて このシリーズでは,英語教育研究でしばしば問題になる統計処理のあり方について私見を述べます。後で詳しく書きま…

青い目の人形の現存率

青い目の人形 青い目の人形ってのは,1927年に日米友好のために,アメリカから日本に送られた人形のこと。当時の日米間は緊張状態にあった。日本人の移民がアメリカでの職を奪っている,という見方の下で,日系人排斥の機運が高まっていた。いわゆる黄禍論み…

マルチレベルのROC曲線

状況 信号検出モデルのおはなし ある信号の有無について多段階評定法(5段階)でデータを取る 横軸にFA(率),縦軸にH(率)を描くとこうなる(ROC曲線) このデータを100人について取るとする もちろん,この曲線にも個人差がある ところで,FA率,H率をz…

分散分析結果の可視化例

よく指導法の効果の検証っていうような目的でこんなグラフを見る。これ,カーネルとか使ってこんな感じでいいじゃない? 名前なんていうかわからんけど。 これパッケージにしたら需要あるんだろうか? 流行ったらいいな。 または,これでもいいな。 library(…

brmsパッケージでカーブフィッティング

計量言語学のMenzerath-Altmann法則をbrmsで。(a) s<-1:5 m<-c(3.1,2.53,2.29,2.12,2.09) dat <- data.frame(s, m) my.prior <- prior(normal(0,3), nlpar = a) + prior(normal(0,1), nlpar = b) + prior(normal(0,1), nlpar = c) fit <- brm(bf(m ~ (a*s^…

AtomからRを使うための設定(Ubuntu系OS)

お気に入りのエディタからなにがなんでも出たくないという病気。 ここ3年はAtom推しなので,今回はAtomからRを使用する環境を作る。環境は,Lubuntu 18.04 LTS。 でも別にこのOSがなにか特別なわけじゃない。これまでAtomからRを使うときは,Atomのパッケー…

ひとに統計相談をするための8つの基本的なTips

その1:データや資料を必ず用意する 統計を得意とするひとであっても,実際のデータやそれに関する資料などが,手元に全くない状態において,(しばしば不正確で非専門的ないい方による)文字や音声だけによる情報で正確に相談の意図を把握することは簡単で…

RでABAB計画のグラフ

応用行動分析(ABA)とかで行われるABABデザイン(外国語教育研究では単一事例分析として知られる)の結果について可視化するグラフを描く必要がある。行動系の論文でよくみるこんなやつ。 えっと,ここではABAB計画(baseline - treatment - baseline - tre…

私の一日とチャップマン=コルモゴロフ方程式

授業がない日のわたし,たとえば出張のない土日とか,10時から22時まで学校にいるとして,大抵は以下のような状態を自由に遷移している。 研究関係のお仕事:論文の執筆,資料・論文・書籍を読む,データ分析,調査・実験の準備,やりたくない査読,共同研究…

Stanでカーブフィッティング:Menzerath-Altmann法則

もうしつこいのはわかっているけど,また,Menzerath-Altmann法則のはなし。この法則はよく知られた言語法則のひとつで,言語的構成要素の大きさは,その構成要素の大きさの関数だという観察で,具体的には,(a)という関数がよくフィットすることが知られ…

カーブフィッティング+ブートストラップ

また懲りずにMenzerath-Altmann法則の話。こんなデータがあって, Morpheme Length(Syllables) Syllable Length(Phonemes) 1 3.10 2 2.53 3 2.29 4 2.12 5 2.09 Gabriel Altmann (1980). "Prolegomena to Menzerath's law". Glottometrika. 2: 1–10. こ…

言語法則とベイズ的なカーブフィッティング

続きもので書いていたつもりだったのだけど,放置しすぎて前回からの更新間隔がえげつないことになってしまった。前回は,Menzerath-Altmann法則をRのnls関数で - 草薙の研究ログっていう話だった。えっと,「ある言語学的単位の平均長(y)は,その構成要素…

Menzerath-Altmann法則と一般化ガンマ分布(Eroglu, 2013)

とても興味深いこと。Eroglu(2013)は,Menzerath-Altmann法則と一般化ガンマ分布の関係について説明している。 Eroglu, S. (2013). Menzerath-Altmann law for distinct word distribution analysis in a large text. Physica A, 392, 2775 – 2780 Menzera…

Menzerath-Altmann法則をRのnls関数で

Menzerath-Altmann法則(またはMenzerath法則; e.g., Altmann, 1980; 基本的アイデアはMenzerathが発見,Altmannが定式化)とは,ある言語学的単位の増加が,その単位の構成要素の減少に帰着すること。またはその逆。もっと一般的にいうと,Altmann(1980)…

GAMLSSとBAMLSSで分布をデータにフィット

GAMLSSとBAMLSS 新幹線に乗ってコンビニにいくようなものだけど,GAMLSSとそのベイズ的モデルであるBAMLSSを使って,観測のデータに対して分布をフィットさせる。 GAMLSSというのは,「位置,尺度,形状,それぞれの母数のための一般化加法モデル(Generaliz…

オンライン外国語学習における実測学習時間の格差:ジニ係数とローレンツ曲線

同じ学習教材を与えても,それを使用して勉強するひともいれば,勉強しないひともいる。格差,ということばが正しいかはわからないけど,たとえば大学生が,ある一定期間内において,大学が提供するオンライン外国語学習教材を使用して学習する時間は,ちょ…

JansonとOllssonのイオタ

JansonとOllssonのイオタは,評定変数が多変量で複数評定者間の信頼性ないし一致率を評価する係数。Rでは,irrパッケージのiota関数を使う。 たとえばルーブリックを使用した評定を二人が行い,観点が5つあるとか,そんなときに使用する。 #こんなデータに […

左に歪んだデータへのフィッティング

確率分布のフィッティングでは,右に歪んだデータを対象にすることが多いのだけど,たまに左に歪んだ分布が手に入ることもある(てか私は最近はじめて手にいれた)。いろいろあるんだろうけど,一般化極値分布でいいかな。えっと,こんなデータだとしよう。 …

最尤法を使った逆ガウス分布のフィッティング

このブログへコメントがあったので,こちらで。 逆ガウス分布をデータに対して最尤法を使用してフィットする方法について。 statmodパッケージに逆ガウス分布の関数があって,それをfitdistrplusパッケージで使う。 #使うパッケージ library(statmod) librar…

Principal Component Factor Analysis?

1日に2回この謎の用語を見てしまったので,Google Scholarで検索したら,1万件超えててワロタ。ま,google検索の件数もそんなに信用できるもんじゃないけど。 https://scholar.google.co.jp/scholar?q=%22principal+component+factor+analysis%22&btnG=&hl=j…

モデルってことばが如何に重要か

最近,モデルってことばが思ったよりもすげえ重要だなって思うようになった。自分の分野(外国語教育)だとあまり聞かない用語だから,避けてたけど,これむしろ積極的に使ったほうがいいな。 モデルってのはモデル化したいものそのものじゃない。別にこの世…

Rで混同行列から感度・特異度などの指標

例えば,何かの指標なりモデルを用いて, 二値的に何かの状態がある(陽性)かない(陰性)かを検査する方法を作るとする。 そのパフォーマンスは以下のような真の状態と検査結果の混同行列を見るとわかる。この場合の混同行列は, 真の状態が陽性 真の状態…

わーい!どんなときでも有意差を見つけられるフレンズなんだね!

「思ったように有意差が出なかったんですけどなにかこのデータから言えることはありませんか?」 「どんなデザインですか?」 「処置群・統制群,事前・事後,成果変数は1です」 「そうですね…まずは処置群を恣意的に何パターンかに分割してみましょう!そう…