草薙の研究ログ

英語教育関係。でも最近は統計(特にR)ネタが中心。

Menzerath-Altmann法則と一般化ガンマ分布(Eroglu, 2013)

とても興味深いこと。Eroglu(2013)は,Menzerath-Altmann法則と一般化ガンマ分布の関係について説明している。

Eroglu, S. (2013). Menzerath-Altmann law for distinct word distribution analysis in a large text. Physica A, 392, 2775 – 2780

Menzerath-Altmann法則は,

(a)y(x|A, b, c) = A x^b e^{-cx}

という風に書ける。

ここで,b = 0,c ≒ 0のとき,

(b)y(x|A,c) = Ae^{-cx}

となる。これは普通の指数関数。

で,b ≒ 0,c = 0のとき,

(c)y(x|A,b) = Ax^{-b}

これはZipfの法則。


ここで,一般化ガンマ分布の確率密度関数を(d)のように書くとする(parameterizationもいろいろあるが…)。

(d)y(x|α,β,θ) = \frac{β}{θγ(α)}(\frac{x}{θ})^{αβ-1}e^{-(\frac{x}{θ})^β}

β = 1のとき,(d)式はガンマ分布の確率密度関数になるし,β=θのとき,ワイブル分布の確率密度関数になる。その上,ガンマ分布は,母数の値によっては,指数分布にもなるし,アーラン分布にもなる。

で,いちばん大事なんだけど,A = (θ^αγ(α))^{-1},b = α-1,c = \frac{1}{θ}のとき,(d)式は(a)式になるらしい(Eroglu, 2013, p. 2776)。なるほど。

…なんだか,とっても安心する。