Snake avec apprentissage par renforcement

Nombre d'épisodes

Max steps par épisode

Alpha (α) - Taux d'apprentissage

Gamma (γ) - Facteur de discount

Epsilon (ε) - Exploration initiale

Taille de la grille

Nombre d'épisodes

Nombre total de parties que l'agent va jouer

Min: 1 | Max: illimité

Max steps par épisode

Nombre maximal de mouvements autorisés par partie

Min: 10 | Max: illimité

Alpha (α) - Taux d'apprentissage

Vitesse à laquelle l'agent apprend de ses expériences

Min: 0.01 | Max: 1

Gamma (γ) - Facteur de discount

Importance accordée aux récompenses futures

Min: 0 | Max: 1

Epsilon (ε) - Exploration initiale

Probabilité d'explorer au hasard au début (vs exploiter ce qu'on a appris)

Min: 0 | Max: 1

Taille de la grille

Dimensions du plateau de jeu (grille × grille)

Min: 5 | Max: 20

Pas de visualisation

Fréquence d'affichage du jeu (1 frame tous les N pas)

Min: 1 | Max: illimité

Vitesse de visualisation

Episode: 0

Score: 0

Pommes mangees: 0

Pas: 0

Epsilon: 1.00

Recompense moyenne par episode