Carla follow lane DDPG Vs PPO Vs SAC [May 2nd]
Objetivos de esta semana:
- Revisar si cubrimos numero de horas de formación con los cursos
- Castigar casos en los que el agente no sigue las recomendación de la percepción y resetear el entrenamiento. cambios abruptos de percepción. Por posición GPS.
- Revisar percepciones en curvas
- Primero resolver entrenamiento en intersecciones para reaplicar entrenamiento en
- Town01
- Town03
- Town04
- Todos
- Para luego hacer inferencias con n ejecuciones en las distintas ciudades + pruebas puntuales que ilustren diferencias clave entre los distintos agentes Salida de carril
- Velocidad media
- Desviación media
- Histogramas de velocidades y distancias
More details in the following slides