Carla follow lane DDPG Vs PPO Vs SAC [June 3st]
Plan de Evaluación y Mejora de Agentes
Verificar puntos iniciales por ciudad
- Aproximadamente 200–300 puntos por ciudad
Episodios por entrenamiento
- DDPG: 1,000 episodios
- SAC: 2,000 episodios
- PPO: 15,000 episodios
Refinar agentes
- ✅ SAC y DDPG: Corrigido problema de rizado y volantazos al frenar
- 🔄 PPO: El throttle es muy estático y no frena lo suficiente para lograr una conducción suave — pendiente de mejora
Evaluación cuantitativa de entrenamientos (BM)
- Analizar y comparar los 3 modelos en distintos aspectos:
- Velocidad media
- Rizado (desviación típica)
- Histogramas de velocidad y desviación
- Invasión de carril
- Evaluación en varias ciudades
More details in the following slides