Bradley-Terry モデル

昨日のレーティングは、線形近似で400点差が勝率100%になるように単位が調整
されています。しかし数学的には、より扱いやすい「Bradley-Terry モデル」が
使われることが多いようです。

期待勝率 = 3 ^ (レート差/200) / (3 ^ (レート差/200) + 1)
      = (1 + tanh( (ln 3) × (レート差/400)) / 2

 200点差 勝率75% (3勝1敗ペース)
 400点差 勝率90% (9勝1敗ペース)

10年余り前にこれの扱いを整理したことがありました。

http://www.asahi-net.or.jp/~dd6t-sg/rating.txt

この整理で最後に宿題になっていた

|(*) (14)を微分して得られる確率密度関数は sech の形をしています。これを
|フーリエ変換したものの平方根を逆フーリエ変換したものが、初等関数で書ける
|と見通しがよいのですが…

に進展があったのでメモ

冒頭の期待勝率はロジスティック曲線と呼ばれ、統計学的にはロジステック分布
の累積分布関数です。

「見通しがよい」というのは、このロジステック分布が、

(A) 対局者の一局のパーフォーマンスが何らかの分布をする確率変数で表現でき
(B) 両対局者のうち一局のパーフォーマンスが下回った方がその一局の敗者となる
(ただし「何らかの分布」の平均は対局者のレートで、形は対局者によらない)

というモデルに帰着できることになるからです。

自力では計算できなかったのですが Wikipedia をみて見つけました。

ロジステック分布

ロジスティック分布の特性関数/exp(iμt)
= B(1-ist, 1+ist)
= Γ(1-ist)×Γ(1+ist) [1]

つまり、特性関数/exp(iμt) = Γ(1-ist) である分布を見つければ、
それが探している分布です。

答はガンベル分布

ガンベル分布の特性関数/exp(iμt) = Γ(1-ist)

Wikipediaの説明の中にある

>さまざまな分布に従う確率変数の最大値が漸近的に従う分布

は「一局のパーフォーマンスは、その一局で指した指手のうちパーフォーマンス
が最低の手のパーフォーマンスで定まる」と解釈できます。
一手一手のパーフォーマンスがさまざまな分布でも、何十手も指せばそれらの
うちの最低のパーフォーマンスの分布はガンベル分布に漸近するというわけです。

何のことはない、冒頭の期待勝率は「敗着を指した方が負け」という極めて
単純なモデル[2]で導出できるということになります。

[1] 公式 B(x,y) = Γ(x)×Γ(y) / Γ(x+y)
     Γ(2) = 1! = 1

[2] もちろん、あくまで単なるモデルです。

この記事へのコメント

この記事へのトラックバック