将棋AIで学ぶディープラーニング on Mac and Google Colab

AI

[モンテカルロ木探索]
第12章

将棋AIの評価値の計算方法

将棋AIの評価値と勝率の関係は下記の式で表される。普通のシグモイド関数である。

r:勝率
x:評価値
a:定数。aが大きいほど評価値あたりの勝率の変化が急峻になる。将棋AIではa=1/600が使われることが多いらしい。USIプロトコルでは歩1枚の価値を100点とした評価値で表すらしい。a=1/600のとき歩1枚が100点になるということだと思われる。

コメント

タイトルとURLをコピーしました