Guide des paramètres
Nombre d'épisodes
Nombre total de parties que l'agent va jouer
Min: 1 | Max: illimité
Max steps par épisode
Nombre maximal de mouvements autorisés par partie
Min: 10 | Max: illimité
Alpha (α) - Taux d'apprentissage
Vitesse à laquelle l'agent apprend de ses expériences
Min: 0.01 | Max: 1
Gamma (γ) - Facteur de discount
Importance accordée aux récompenses futures
Min: 0 | Max: 1
Epsilon (ε) - Exploration initiale
Probabilité d'explorer au hasard au début (vs exploiter ce qu'on a appris)
Min: 0 | Max: 1
Taille de la grille
Dimensions du plateau de jeu (grille × grille)
Min: 5 | Max: 20
Pas de visualisation
Fréquence d'affichage du jeu (1 frame tous les N pas)
Min: 1 | Max: illimité
Aucun entraînement effectué. Lancez d'abord un entraînement.