Next:
2.2.2 状態
Up:
2.2 内部表現
Previous:
2.2 内部表現
2.2.1 局面(盤面)
局面を表すのには、以下の3つのファンクタ構造を用いる。
ox/9
アトム
'o'
,
'x'
,
' '
を引数にもつ。 これは便宜的に用意したもので、内部では特に使わない。
b/9
ox/9 の各コマを数値で表したもので、
'o'
→ 1,
'x'
→ -1,
' '
→ 0 で局面を表す。
d/10
b/9 に対称変換を施し、同時にプレーヤから見た局面に変換したものである。 d/10 では第1引数で対称変換情報を表し、残りの9引数で局面を表すが、 その際自分のコマは 2, 相手のコマは 1 として表されている。
Q-learning により学習を行う Tic-Tac-Toe プログラム