Inicializando motor de física...
Panel de Control
Agente
psychology
Agente Q-Table
Inactivo
Estadísticas
0
Episodio
0
Pasos
0.0
Recompensa
0.0
Mejor
0
Estados-Q
0%
Éxito
Rendimiento
Recompensas
Promedio (10)
Algoritmo
Hiperparámetros
Tasa de Aprendizaje
0.001
Descuento (γ)
0.99
Exploración (ε)
0.20
Entorno
Laberinto
Dinámico
Obstáculos
Simple
Visualización
Diseño de Recompensas
1x