Carla follow lane DDPG Vs PPO Vs SAC [October week 4 - November week 1]

less than 1 minute read

Expected Goals

  • Tras leer un ártículo me surgió la duda de si con los últimos cambios, una red más pequeña podría hacer el trabajo
    • Con menos capas y más neuronas NO
    • Con menos capas y mismas neuronas SI
  • Variabilidad del entrenamiento
    • Utilizar una métrica en inferencia para representar distribución (campana de gaus?) con N entrenamientos idénticos
  • Algoritmos
    • TD3
    • SAC
    • PPO (optional)
    • DDPG (optional)
  • Métricas
    • Lane invasions
    • Desviación típica
    • Speed
  • Estudiar en la literatura
    • Cuantos entrenamientos son representativos?
    • Explorar si hay otras técnicas para elegir el mejor modelo durante el entrenamiento
    • La más utilizada es la misma que utilizamos nosotros
  • Redacción del SOTA.

More details in the following slides