Carla follow lane DDPG Vs PPO Vs SAC [May 1st]

less than 1 minute read

Objetivos de esta semana:

  • Incluir en entrenamiento Town01
  • Incluir en inferencia Town02
  • Solucionar problemas en town05 y town06
  • Versión formal para pedir feedback sobre “introducción” y “trabajo relacionado”
  • Volcar un poco más en la toma de decisión que en percepción y DRL de lo general a lo particular
  • Inferencia en town05, town06 y town10
  • Distancias en pixeles (indicando el número total)
  • Terminar entrenamientos de agentes que faltan
  • Explorar el impacto de meter “misalignment” en la recompensa

More details in the following slides