ひとに統計相談をするための8つの基本的なTips

統計ライフハック

その1：データや資料を必ず用意する統計を得意とするひとであっても，実際のデータやそれに関する資料などが，手元に全くない状態において，（しばしば不正確で非専門的ないい方による）文字や音声だけによる情報で正確に相談の意図を把握することは簡単で…

2018-08-16

気軽に「説明」とはもういわない

もういわない

説明あいも変わらず，不勉強ゆえに，よく考えずに軽々しく，説明などという難しいことばを何度も使ってきたものだが（幸いなことにあまり自分の論文や原稿には使用例が見当たらなかったが），他人の使用はどうであれ，私はこの説明ということばを軽々しく使…

2018-08-16

RでABAB計画のグラフ

r 教育統計

応用行動分析（ABA）とかで行われるABABデザイン（外国語教育研究では単一事例分析として知られる）の結果について可視化するグラフを描く必要がある。行動系の論文でよくみるこんなやつ。えっと，ここではABAB計画（baseline - treatment - baseline - tre…

2018-07-18

行動についてゲーテ

名言

痺れたぁ。ゲーテのことばらしい。「行動は，それ自身に魔法と力と恩寵を備えている」 "Action has magic, power and grace in it." 本当に素晴らしいことばだ。

2018-06-27

「客観的」とはもういわない

もういわない

客観的ということばのあいまいさこれまた不勉強故で「客観的」ということばを使ってしまっていたのだけど（幸い自分の論文を探したらあまり出てくることがなかったが），少なくとも外国語教育研究では，このことばは非常にあいまいであり効率的なコミュニケ…

2018-06-17

（観測変数Aが構成概念Bを）「測定する」とはもういわない

もういわない

他人の使用がどうであるかはとりあえず置いておいて，私は，「観測変数Aが構成概念Bを測定する」（"A measures B"）やそれに類する表現（"what A measures is B"）を二度と使わないと田舎のボケたおばあちゃんに誓った。昔，あまりよく考えずに使ってしまっ…

2018-06-16

頭の中に追い込むときっとそれはどこかへ逃げていく

雑感教育

よくある話「私の学生たちには，話すことに対する不安があるため，英語を話す課題を与えても一向に英語を話さない」「私の学生たちは，動機づけの程度が低いため，英語を話す課題を与えても一向に英語を話さない」「私の学生たちは，やる気がないため，英…

2018-06-15

RでKendall距離，Hamming距離，Cayley距離，Ulam距離

r

順序間の距離を表す，（編集型の）上記の距離をRでもとめる。PerMallowsパッケージというのを使う。 library(PerMallows) x<-c(1,2,3,4,5,6,7,8,9,10) y<-c(2,1,3,4,6,5,7,9,8,10) distance(x,y,"Kendall") distance(x,y,"Hamming") distance(x,y,"Cayley") …

2018-06-06

Rで繰り返し数列を振る

1, 2, 3, ... nという連番を振るなら， 1:10 seq(1,10,1) などとやればよいのだけど，1からnまでの連番をm回繰り返したいときがある。たとえば1, 2, 3, 1, 2, 3, 1, 2, 3みたいな。これもrep関数で便利にできる。 rep(1:3, 3) しかし，1, 1, 1, 2, 2, 2, 3…

2018-05-28

全然わからない研究の話に巻き込まれたときに使う表現集

雑感ライフハック

よくわからない研究の話に巻き込まれる！私は，大学において外国語科目の授業を行い，外国語の教育，特に高等教育におけるそれに関することを一応研究上の専門としているのだけど，この分野は「〇〇学」と一括りにできるようなものではない。たとえば，私の…

2018-01-31

私の一日とチャップマン＝コルモゴロフ方程式

r 統計

授業がない日のわたし，たとえば出張のない土日とか，10時から22時まで学校にいるとして，大抵は以下のような状態を自由に遷移している。研究関係のお仕事：論文の執筆，資料・論文・書籍を読む，データ分析，調査・実験の準備，やりたくない査読，共同研究…

2018-01-30

Stanでカーブフィッティング：Menzerath-Altmann法則

r 統計

もうしつこいのはわかっているけど，また，Menzerath-Altmann法則のはなし。この法則はよく知られた言語法則のひとつで，言語的構成要素の大きさは，その構成要素の大きさの関数だという観察で，具体的には，（a）という関数がよくフィットすることが知られ…

2018-01-30

「反応時間がはやい」のカテゴリー錯誤

雑感

2018年もまた見てしまった… はやい反応時間という表現。これが，外国語教育研究を含むある種の学術領域において，かなり慣習的な表現になっていることは知っている。たとえば，google scholarで以下のような表現を検索してみると，かなりの件数が表示される…

2018-01-09

カーブフィッティング＋ブートストラップ

r 統計

また懲りずにMenzerath-Altmann法則の話。こんなデータがあって， Morpheme Length（Syllables） Syllable Length（Phonemes） 1 3.10 2 2.53 3 2.29 4 2.12 5 2.09 Gabriel Altmann (1980). "Prolegomena to Menzerath's law". Glottometrika. 2: 1–10. こ…

2018-01-04

言語法則とベイズ的なカーブフィッティング

r 統計情報処理

続きもので書いていたつもりだったのだけど，放置しすぎて前回からの更新間隔がえげつないことになってしまった。前回は，Menzerath-Altmann法則をRのnls関数で - 草薙の研究ログっていう話だった。えっと，「ある言語学的単位の平均長（y）は，その構成要素…

2017-09-27

Menzerath-Altmann法則と一般化ガンマ分布（Eroglu, 2013）

統計

とても興味深いこと。Eroglu（2013）は，Menzerath-Altmann法則と一般化ガンマ分布の関係について説明している。 Eroglu, S. (2013). Menzerath-Altmann law for distinct word distribution analysis in a large text. Physica A, 392, 2775 – 2780 Menzera…

2017-09-23

Menzerath-Altmann法則をRのnls関数で

r 統計教育

Menzerath-Altmann法則（またはMenzerath法則; e.g., Altmann, 1980; 基本的アイデアはMenzerathが発見，Altmannが定式化）とは，ある言語学的単位の増加が，その単位の構成要素の減少に帰着すること。またはその逆。もっと一般的にいうと，Altmann（1980）…

2017-09-20

ジニ係数とワイブル分布・対数正規分布・ガンマ分布の母数の関係

どうでもいいことなんだけど，ジニ係数はいくつかの分布であれば，分布の母数から直接的にもとまるんだそうだ。ワイブル分布，対数正規分布，ガンマ分布を例に取ると，ワイブル分布とガンマ分布なら形状母数k（またはα）のみから，対数正規分布ならσのみから…

2017-09-19

GAMLSSとBAMLSSで分布をデータにフィット

r 統計

GAMLSSとBAMLSS 新幹線に乗ってコンビニにいくようなものだけど，GAMLSSとそのベイズ的モデルであるBAMLSSを使って，観測のデータに対して分布をフィットさせる。 GAMLSSというのは，「位置，尺度，形状，それぞれの母数のための一般化加法モデル（Generaliz…

2017-09-18

オンライン外国語学習における実測学習時間の格差：ジニ係数とローレンツ曲線

教育雑感統計

同じ学習教材を与えても，それを使用して勉強するひともいれば，勉強しないひともいる。格差，ということばが正しいかはわからないけど，たとえば大学生が，ある一定期間内において，大学が提供するオンライン外国語学習教材を使用して学習する時間は，ちょ…

2017-09-10

JansonとOllssonのイオタ

r 統計

JansonとOllssonのイオタは，評定変数が多変量で複数評定者間の信頼性ないし一致率を評価する係数。Rでは，irrパッケージのiota関数を使う。たとえばルーブリックを使用した評定を二人が行い，観点が5つあるとか，そんなときに使用する。 #こんなデータに […

2017-07-22

キーボード用リストレストを作ってしまえ

あまりタイピングが上手じゃないのがいけないのだけど，よく腱鞘炎になってしまう。私みたいにもの書きをまったくしないやつに限ってすぐ腱鞘炎になる。そんな軟弱な自分に嫌悪感を覚えながらも，やれキーボードが悪い，そしてリストレストが悪い，この企業…

2017-07-11

左に歪んだデータへのフィッティング

r 統計

確率分布のフィッティングでは，右に歪んだデータを対象にすることが多いのだけど，たまに左に歪んだ分布が手に入ることもある（てか私は最近はじめて手にいれた）。いろいろあるんだろうけど，一般化極値分布でいいかな。えっと，こんなデータだとしよう。 …

2017-07-08

最尤法を使った逆ガウス分布のフィッティング

r 統計

このブログへコメントがあったので，こちらで。逆ガウス分布をデータに対して最尤法を使用してフィットする方法について。 statmodパッケージに逆ガウス分布の関数があって，それをfitdistrplusパッケージで使う。 #使うパッケージ library(statmod) librar…

2017-07-05

Principal Component Factor Analysis?

統計雑感

1日に2回この謎の用語を見てしまったので，Google Scholarで検索したら，1万件超えててワロタ。ま，google検索の件数もそんなに信用できるもんじゃないけど。 https://scholar.google.co.jp/scholar?q=%22principal+component+factor+analysis%22&btnG=&hl=j…

2017-07-01

モデルってことばが如何に重要か

統計雑感

最近，モデルってことばが思ったよりもすげえ重要だなって思うようになった。自分の分野（外国語教育）だとあまり聞かない用語だから，避けてたけど，これむしろ積極的に使ったほうがいいな。モデルってのはモデル化したいものそのものじゃない。別にこの世…

2017-06-14

【宣伝】この学会シーズンでお話させてもらうこと

最近はなんでも広報やその創意工夫が大事だということなので，ここに，この春夏の学会シーズンでお話させて頂くことをまとめます（自分のメモがてら）。増えたら随時足していきます。 1. SONAS2017（5月に終了，早稲田大学）シンポジウム「英語学習者のパフ…

2017-05-20

自分の居場所とラズベリー・パイ（2）

ラズパイ

前回までのあらすじ大学の小さな部屋にある，どでかいワークステーション，デスクトップPC，ThinkPadやMacBookといったメジャーなノートPC，そういった電子機器に底知れぬ違和感を覚え始めた私は，自分が生まれた東北の自然，つまり自分の原風景には，シン…

2017-05-16

自分の居場所とラズベリー・パイ（1）

雑感ラズパイ

私を死に至らしめる電子機器たちヴォオオオオオオオオオーンけたたましいファン音毎日，私は私に割り当てられた大学の部屋に入ると，革のクラッチバッグ（鞄大好き）から，財布，携帯，タバコ，鍵束を取り出して，所定の網棚にセットし，ワークステーショ…

2017-03-02

平均への回帰をわかりやすく例える

なんか平均への回帰ってことばはよく知られているものの，外国語教育研究界隈では，ときに難しいとされていて，そして研究実践においてもものすごく大事なことなのにあんまり重要視されていない気がする。まあ確かに，頑張って教科書読んでも，「相関係数が1…