Carla follow lane DDPG Vs PPO Vs SAC [October week 4 - November week 1]
Expected Goals
- Tras leer un ártículo me surgió la duda de si con los últimos cambios, una red más pequeña podría hacer el trabajo
- Con menos capas y más neuronas NO
- Con menos capas y mismas neuronas SI
- Variabilidad del entrenamiento
- Utilizar una métrica en inferencia para representar distribución (campana de gaus?) con N entrenamientos idénticos
- Algoritmos
- TD3
- SAC
- PPO (optional)
- DDPG (optional)
- Métricas
- Lane invasions
- Desviación típica
- Speed
- Estudiar en la literatura
- Cuantos entrenamientos son representativos?
- Explorar si hay otras técnicas para elegir el mejor modelo durante el entrenamiento
- La más utilizada es la misma que utilizamos nosotros
- Redacción del SOTA.
More details in the following slides