Carla follow lane DDPG Vs PPO Vs SAC [June 3st]

less than 1 minute read

Plan de Evaluación y Mejora de Agentes

Verificar puntos iniciales por ciudad

  • Aproximadamente 200–300 puntos por ciudad

Episodios por entrenamiento

  • DDPG: 1,000 episodios
  • SAC: 2,000 episodios
  • PPO: 15,000 episodios

Refinar agentes

  • SAC y DDPG: Corrigido problema de rizado y volantazos al frenar
  • 🔄 PPO: El throttle es muy estático y no frena lo suficiente para lograr una conducción suave — pendiente de mejora

Evaluación cuantitativa de entrenamientos (BM)

  • Analizar y comparar los 3 modelos en distintos aspectos:
    • Velocidad media
    • Rizado (desviación típica)
    • Histogramas de velocidad y desviación
    • Invasión de carril
    • Evaluación en varias ciudades

More details in the following slides