草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

相関係数の解釈と効果量の解釈

相関係数は標準化された共分散。
共分散は偏差積の平均値。
偏差は平均との距離。

なので、片方の変数が平均から離れている度合いと、もう片方の変数の平均から離れている度合いをかけたものの平均から、スケールの大きさを取り除いたもの。

数学的な含意は、せいぜいが「ある集団内において、全体的に見て片方の変数の値が高ければ(低ければ)、もう片方の変数の値も高い(低い)程度」くらい。

因果関係が強ければ、相関係数は高くなるが、相関係数は因果関係を必ずしも示さない。

相関係数は必ずしも「値の内訳」ではない。給料とルックスに仮に相関があっても「ルックス代」があるとは限らない。

相関係数は必ずしも「構成比」ではない。読解能力と語彙能力に仮に相関があっても「読解処理の何割かが語彙処理」だとは限らない。

奇妙な相関係数の解釈は、簡単な数学的な含意を無視するからであり、それがガラパゴス的なよそでは通用しない「科学」を生む。

効果だっていっしょだ。相関係数は効果量でもある。標準化平均差は点双列相関に換算できる。

よって効果量は因果関係を必ずしも含意しない。効果量は因果のないものにも求められる。因果推論は効果の値の大きさをもとめることで正当化されるものではない。

今の科学では簡単に因果係数といったものをもとめることができない。なので基本は事前に余計な因果や余計な関係を無理矢理外すように実験して、相関係数をもとめるか、たくさんのデータから事後的に外すように処理するかしかない。

科学の基本は因果推論であって、相関係数の共有ではない。科学コミュニティーは因果推論の質を高めあい、洗練させていくのであり、相関係数の鍋パや品評会を楽しむものではない。