|
この名前も聞いたことあったけど...普遍的だなんて...人間界の法則ですね♪
法則を発見する方って目のつけ所が違いますね...^^;v
男女のもて度も案外こんな法則に従ってるんじゃないのかなあ...^^;?
なんていつもながら下世話な話にもって行ってしまうわたし...Orz...
わたしの感心度も...このジップの法則に合致してるんだろか...
個人情報につき公開は憚りますけど...^^
www.tbs.co.jp/.../tsukio/ dr_tsukio20071005.html より Orz〜
「これは、アメリカの言語学者ジョージ・キングズリー・ジップ氏が英語の単語の使用頻度とその順位に関して発見した言語学の法則です。
例えば、英語で一番よく使われる単語が「the」、2番目に出てくる「of」は「the」の出てくる回数の約2分の1、3番目の「and」は約3分の1になるという法則です。
これは言語だけでなく、ウェブページへのアクセス頻度、都市の人口などに適用されるといわれています。・・・」
http://ja.wikipedia.org/wiki/ジップの法則
「ジップの法則あるいはジフの法則(Zipf's law)とは、サイズがk 番目に大きい要素が全体に占める割合が 1 / k に比例するという経験則である。Zipfは「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はゼータ分布(Zeta distribution)の特殊な形である。
由来
元来は、アメリカの言語学者ジョージ・キングズリー・ジフ(George Kingsley Zipf)が英語の単語の使用頻度とその順位に関して発見した言語学の法則である。
法則が成立する現象の例
次のような様々な現象(自然現象、社会現象など)に成り立つ場合があることが確認されている:
単語の使用頻度:言語全体だけでなく、例えば「ハムレット」など1作品中でも成り立つことが示されている。
ウェブページへのアクセス頻度
都市の人口
上位3%の人々の収入
音楽における音符の使用頻度
細胞内での遺伝子の発現量
地震の規模
固体が割れたときの破片の大きさ
数学的な定義
数学的には一般のジップの法則は
(画像)
(ただしN は全要素の数、k は順位)と書き表される。
ここで元来のジップの法則ではs = 1 である。N を無限大にすると分母は収束しない(無限大に発散する)ため、元来のジップの法則ではN を有限としなければならない(現実にもそう考えられる場合が多い)。
ただしs が1より少しでも大きい実数ならば、N を無限大にしても分母は収束し(ゼータ関数 ζ(s) に等しい)、k の値を無限にとりうる分布関数とすることができる。
関連する概念
ジップの法則は冪乗則(Power law)の一種である。また、ジップ分布は変数変換によりパレート分布(連続分布)と同じ形になることが示されている。パレート分布の離散型である。パレートの法則はパレート分布の特別な場合に当たり、また80-20の法則とも関係がある。順位規模の法則とも呼ばれる。」
「ジップの法則
ほぼ100年前の経済学者パレートは個人所得の多い順にならて,1,2,3,・・・と順位をつけその順位を横軸に,縦軸には所得高をとると双曲線様のパワー曲線が描けることを見つけました.すなわち,Nをx以上の所得を有する人の数とするとN=x^(-a)となるという法則です.個人所得高の分布がパレート分布なのですが,同様のパワー則(power law)は経済学分野のみならず,いろいろな分野で見いだされていて,例えば,
(1)社会学における都市人口の分配法則(人口の多い順に都市をならべ,その順位を横軸,縦軸には人口ととると双曲線ができる)
(2)言語学におけるパワー則(ある言語の単語を出現頻度順にならべるとその出現確率は簡単な双曲線則にしたがう)
など,これらを総称してジップの法則といいます.
このようにして導かれた連続分布をパレート分布と呼びます.パレート分布は,経済学者にとっては60年以上昔から知られていて,人文科学領域のみならず,熱力学的解析などにも応用されてきました.また,パレート分布の逆数の分布がべき乗分布です.
母数θを含む確率密度関数f(x)をパラメータまで含めてf(x,θ)と表します.f(x,θ)が与えられているとしましょう.この母数θがまた確率密度関数g(θ)に従うとすると
h(x)=∫f(x,θ)g(θ)dθ
によって新しい確率密度関数h(x)が定義されます.
これでθに関する重み付き平均を考えたことになりますが,位置母数モデルf(x,θ)=f(x-θ)のとき,hはfとgとの畳み込みそのものであり,尺度母数モデルf(x,θ)=f(x/θ)/θのとき,hはfとgの尺度混合であるといいます.
g(θ)としてはガンマ分布が用いられることが多く,たとえば,ポアソン分布(f)をガンマ分布(g)で混合すれば,負の2項分布(h),指数分布を(f)をガンマ分布(g)で混合すれば,パレート分布(h)が得られます.t分布も正規分布をガンマ分布で混合した混合正規分布の1つです.
パレート分布は連続分布ですが,導出された起源を考えると本来の姿は離散分布です.そこで,パレート分布を離散化すると,以下のようなゼータ分布(ジップ分布,離散パレート分布)が得られます.
p(x)=[ζ(a)]^(-1)x^(-a) x=1,2,3,...
μ's=ζ(a-s)/ζ(a)
ここでζ(・)はゼータ関数ですが,ベキ指数はa≧1で,a=1のときはx=1,2,3,...,xmaxのようにxmaxがないとΣp(x)は発散してしまいます.ゼータ分布は単調減少する分布で非常に裾が長い分布です.」
なんのこっちゃわからない...^^;;
この法則...数学の得意な方...説明できませんでしょうかしら...?
|