単語の出現頻度

単語の出現頻度には法則性があると言われます.

言語には,このような法則性が,どの位あるのか興味があります.

また,そうした法則が異なる言語間でも通用して,言語の近接性がパラメーターの距離で表現されるとするなら,非常に面白そうです.

「単語のそのような出現頻度の実態は,「ポアソン=ディリクレ過程」という統計モデルで説明できる.持橋によれば,「それは簡単に言うと“rich gets richer”つまり,いったん頻度が高くなった単語はどんどん頻度が高くなるという現象のモデル化で説明される」という.」
生きたことばをモデル化する統計科学の研究:研究室訪問:統計数理研究所


2015年2月1日


Mathematics is the language with which God has written the universe.





















wがつくことば - 単語の出現頻度 - 大学の研究とテクノロジー - 原始重力波 - 自動車メーカーの立ち位置