Snake avec apprentissage par renforcement

Projet d'apprentissage par renforcement via Q-Learning

Guide des paramètres

Nombre d'épisodes
Nombre total de parties que l'agent va jouer
Min: 1 | Max: illimité
Max steps par épisode
Nombre maximal de mouvements autorisés par partie
Min: 10 | Max: illimité
Alpha (α) - Taux d'apprentissage
Vitesse à laquelle l'agent apprend de ses expériences
Min: 0.01 | Max: 1
Gamma (γ) - Facteur de discount
Importance accordée aux récompenses futures
Min: 0 | Max: 1
Epsilon (ε) - Exploration initiale
Probabilité d'explorer au hasard au début (vs exploiter ce qu'on a appris)
Min: 0 | Max: 1
Taille de la grille
Dimensions du plateau de jeu (grille × grille)
Min: 5 | Max: 20
Pas de visualisation
Fréquence d'affichage du jeu (1 frame tous les N pas)
Min: 1 | Max: illimité

Visualisation du jeu

1x

Statistiques en temps réel

Episode: 0
Score: 0
Pommes mangees: 0
Pas: 0
Epsilon: 1.00

Progression

0%

Aucun entraînement effectué. Lancez d'abord un entraînement.