Carla follow lane DDPG Vs PPO Vs SAC [May 1st]
Objetivos de esta semana:
- Incluir en entrenamiento Town01
- Incluir en inferencia Town02
- Solucionar problemas en town05 y town06
- Versión formal para pedir feedback sobre “introducción” y “trabajo relacionado”
- Volcar un poco más en la toma de decisión que en percepción y DRL de lo general a lo particular
- Inferencia en town05, town06 y town10
- Distancias en pixeles (indicando el número total)
- Terminar entrenamientos de agentes que faltan
- Explorar el impacto de meter “misalignment” en la recompensa
More details in the following slides