言語には,このような法則性が,どの位あるのか興味があります.
また,そうした法則が異なる言語間でも通用して,言語の近接性がパラメーターの距離で表現されるとするなら,非常に面白そうです.
「単語のそのような出現頻度の実態は,「ポアソン=ディリクレ過程」という統計モデルで説明できる.持橋によれば,「それは簡単に言うと“rich gets richer”つまり,いったん頻度が高くなった単語はどんどん頻度が高くなるという現象のモデル化で説明される」という.」
生きたことばをモデル化する統計科学の研究:研究室訪問:統計数理研究所
Vita brevis, ars longa. Omnia vincit Amor.