読者です 読者をやめる 読者になる 読者になる

草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

層別データの可視化:plot関数が思ったより賢い件

何故か知らんかった。plot関数って思ったより賢い。(いや,plot関数が賢いのは昔から当たり前なんだけど)

ひとつのグループ化変数とひとつの連続量を入れたデータフレームがあるとする。

こんなふうにして作ろう。

group<-c(rep("a",25),rep("b",25))
score<-c(rnorm(25,50,10),rnorm(25,60,10))
data.frame(group,score)->dat

plot(dat)

こんな風にグループ化変数(っていうかカテゴリカルデータ)で層別に集計して出してくれる。

f:id:kusanagik:20160517195629p:plain

かしこ機能キタコレ↑↑

これは,

boxplot(dat)

ってやるとダメ。受けるwww

ちょっと面白いのは,層別の五数要約をもとめるときに,

plot(dat)$stats

これでいける。
もちろん,これは,

tapply(dat$score,dat$group,quantile)

といっしょ。仕様の問題で前者は行列で,後者はリストで出してくる。