Carla follow lane DDPG Vs PPO Vs SAC [October week 4 - November week 1]

less than 1 minute read

Tras leer un ártículo me surgió la duda de si con los últimos cambios, una red más pequeña podría hacer el trabajo
- Con menos capas y más neuronas NO
- Con menos capas y mismas neuronas SI
Variabilidad del entrenamiento
- Utilizar una métrica en inferencia para representar distribución (campana de gaus?) con N entrenamientos idénticos
Algoritmos
- TD3
- SAC
- PPO (optional)
- DDPG (optional)
Métricas
- Lane invasions
- Desviación típica
- Speed
Estudiar en la literatura
- Cuantos entrenamientos son representativos?
- Explorar si hay otras técnicas para elegir el mejor modelo durante el entrenamiento
- La más utilizada es la misma que utilizamos nosotros
Redacción del SOTA.

Retraining YOLOPv2 with CARLA images (March week 2 - April week 1)