Bradley-Terry モデル
昨日のレーティングは、線形近似で400点差が勝率100%になるように単位が調整
されています。しかし数学的には、より扱いやすい「Bradley-Terry モデル」が
使われることが多いようです。
期待勝率 = 3 ^ (レート差/200) / (3 ^ (レート差/200) + 1)
= (1 + tanh( (ln 3) × (レート差/400)) / 2
200点差 勝率75% (3勝1敗ペース)
400点差 勝率90% (9勝1敗ペース)
10年余り前にこれの扱いを整理したことがありました。
http://www.asahi-net.or.jp/~dd6t-sg/rating.txt
この整理で最後に宿題になっていた
|(*) (14)を微分して得られる確率密度関数は sech の形をしています。これを
|フーリエ変換したものの平方根を逆フーリエ変換したものが、初等関数で書ける
|と見通しがよいのですが…
に進展があったのでメモ
冒頭の期待勝率はロジスティック曲線と呼ばれ、統計学的にはロジステック分布
の累積分布関数です。
「見通しがよい」というのは、このロジステック分布が、
(A) 対局者の一局のパーフォーマンスが何らかの分布をする確率変数で表現でき
(B) 両対局者のうち一局のパーフォーマンスが下回った方がその一局の敗者となる
(ただし「何らかの分布」の平均は対局者のレートで、形は対局者によらない)
というモデルに帰着できることになるからです。
自力では計算できなかったのですが Wikipedia をみて見つけました。
ロジステック分布
ロジスティック分布の特性関数/exp(iμt)
= B(1-ist, 1+ist)
= Γ(1-ist)×Γ(1+ist) [1]
つまり、特性関数/exp(iμt) = Γ(1-ist) である分布を見つければ、
それが探している分布です。
答はガンベル分布
ガンベル分布の特性関数/exp(iμt) = Γ(1-ist)
Wikipediaの説明の中にある
>さまざまな分布に従う確率変数の最大値が漸近的に従う分布
は「一局のパーフォーマンスは、その一局で指した指手のうちパーフォーマンス
が最低の手のパーフォーマンスで定まる」と解釈できます。
一手一手のパーフォーマンスがさまざまな分布でも、何十手も指せばそれらの
うちの最低のパーフォーマンスの分布はガンベル分布に漸近するというわけです。
何のことはない、冒頭の期待勝率は「敗着を指した方が負け」という極めて
単純なモデル[2]で導出できるということになります。
[1] 公式 B(x,y) = Γ(x)×Γ(y) / Γ(x+y)
Γ(2) = 1! = 1
[2] もちろん、あくまで単なるモデルです。
されています。しかし数学的には、より扱いやすい「Bradley-Terry モデル」が
使われることが多いようです。
期待勝率 = 3 ^ (レート差/200) / (3 ^ (レート差/200) + 1)
= (1 + tanh( (ln 3) × (レート差/400)) / 2
200点差 勝率75% (3勝1敗ペース)
400点差 勝率90% (9勝1敗ペース)
10年余り前にこれの扱いを整理したことがありました。
http://www.asahi-net.or.jp/~dd6t-sg/rating.txt
この整理で最後に宿題になっていた
|(*) (14)を微分して得られる確率密度関数は sech の形をしています。これを
|フーリエ変換したものの平方根を逆フーリエ変換したものが、初等関数で書ける
|と見通しがよいのですが…
に進展があったのでメモ
冒頭の期待勝率はロジスティック曲線と呼ばれ、統計学的にはロジステック分布
の累積分布関数です。
「見通しがよい」というのは、このロジステック分布が、
(A) 対局者の一局のパーフォーマンスが何らかの分布をする確率変数で表現でき
(B) 両対局者のうち一局のパーフォーマンスが下回った方がその一局の敗者となる
(ただし「何らかの分布」の平均は対局者のレートで、形は対局者によらない)
というモデルに帰着できることになるからです。
自力では計算できなかったのですが Wikipedia をみて見つけました。
ロジステック分布
ロジスティック分布の特性関数/exp(iμt)
= B(1-ist, 1+ist)
= Γ(1-ist)×Γ(1+ist) [1]
つまり、特性関数/exp(iμt) = Γ(1-ist) である分布を見つければ、
それが探している分布です。
答はガンベル分布
ガンベル分布の特性関数/exp(iμt) = Γ(1-ist)
Wikipediaの説明の中にある
>さまざまな分布に従う確率変数の最大値が漸近的に従う分布
は「一局のパーフォーマンスは、その一局で指した指手のうちパーフォーマンス
が最低の手のパーフォーマンスで定まる」と解釈できます。
一手一手のパーフォーマンスがさまざまな分布でも、何十手も指せばそれらの
うちの最低のパーフォーマンスの分布はガンベル分布に漸近するというわけです。
何のことはない、冒頭の期待勝率は「敗着を指した方が負け」という極めて
単純なモデル[2]で導出できるということになります。
[1] 公式 B(x,y) = Γ(x)×Γ(y) / Γ(x+y)
Γ(2) = 1! = 1
[2] もちろん、あくまで単なるモデルです。
この記事へのコメント