Week 26 – Cambio de nivel de abstracción en acciones y entrenamiento con velocidades
Week 26 – Cambio de nivel de abstracción en acciones y entrenamiento con velocidades
Avances
- Se realizó un cambio en el nivel de abstracción de las acciones del agente, pasando de comandos directos del simulador (steer, throttle, brake) a un espacio de acción más físico y generalizable basado en velocidad lineal (v) y velocidad angular (ω).
- Se modificaron los scripts de grabación de dataset para registrar (v, ω) directamente desde el estado cinemático del vehículo en CARLA, manteniendo sincronización por frame con las imágenes RGB.
- Se adaptó el pipeline de entrenamiento (Dataset, modelo y head de regresión) para aprender el nuevo espacio de acción (v_mps, omega_rps) usando MobileNetV2 con transfer learning.
- Se mantuvo la arquitectura existente (hilos, colas, callbacks y sincronización) para asegurar compatibilidad y estabilidad con los scripts previos de control y captura.
Pruebas realizadas
- Verificación de la correcta extracción de velocidad hacia adelante mediante proyección del vector velocidad sobre el eje forward del vehículo.
- Validación del cálculo de yaw rate (ω) a partir de la velocidad angular en el eje Z.
- Comprobación de la consistencia temporal entre imágenes y etiquetas usando snapshot.frame e image.frame.
- Entrenamiento inicial del modelo con el nuevo dataset para confirmar convergencia de la loss en un problema de regresión continua de dos dimensiones.
Resultados preliminares
- El nuevo dataset desacopla al modelo de los detalles específicos del actuador del simulador, facilitando la transferencia entre vehículos y configuraciones.
- El entrenamiento con (v, ω) muestra un aprendizaje más estable que con controles crudos, especialmente en curvas y transiciones suaves.
- Se sienta la base para integrar un controlador cinemático intermedio que traduzca las salidas del modelo a comandos de bajo nivel.
Próximos pasos
- Implementar un controlador de ejecución (PID de velocidad + conversión ω → steer) para cerrar el loop de inferencia en CARLA.
- Integrar Behavior Metrics para evaluar no solo seguimiento de carril, sino suavidad, estabilidad y seguridad del comportamiento generado.
- Analizar la necesidad de normalización o clipping de las salidas (v, ω) durante inferencia para evitar comandos físicamente inviables.
- Retomar pruebas de conducción autónoma completa una vez integrado el nuevo controlador.