Probabilistic neural network playing and learning Tic-Tac-Toe

Grim Jiří, Somol Petr, Pudil Pavel

: Pattern Recognition Letters vol.26, 12 (2005), p. 1866-1873

: neural networks, distribution mixtures, playing games

(eng): A probabilistic neural network is applied as a tool to approximate the statistical evaluation function for a simple version of the game Tic-Tac-Toe. We solve the problem by a sequential estimation of the underlying discrete distribution mixture of product components. The training data is obtained by observing a simple artifical player based on a look-up table. The resulting neural network outperforms the artificial player both in the starting and defending position.

(cze): Pravděpodobnostní neuronová síť je použita jako nástroj pro aproximaci statistické evaluační funkce pro hru "piškvorky". Řešení spočívá v odhadu distribuce výhodných stavů ve tvaru distribuční směsi s použitím EM algoritmu. Trénovací datový soubor je získáván záznamem úspěšných tahů ze hry simulované pomocí jednoduchého algoritmu. Výsledná neuronová síť je úspěšnější než umělý algoritmus jak v zahajovací tak i v obranné pozici.

