Week 26 – Cambio de nivel de abstracción en acciones y entrenamiento con velocidades

1 minute read

Avances

Se realizó un cambio en el nivel de abstracción de las acciones del agente, pasando de comandos directos del simulador (steer, throttle, brake) a un espacio de acción más físico y generalizable basado en velocidad lineal (v) y velocidad angular (ω).
Se modificaron los scripts de grabación de dataset para registrar (v, ω) directamente desde el estado cinemático del vehículo en CARLA, manteniendo sincronización por frame con las imágenes RGB.
Se adaptó el pipeline de entrenamiento (Dataset, modelo y head de regresión) para aprender el nuevo espacio de acción (v_mps, omega_rps) usando MobileNetV2 con transfer learning.
Se mantuvo la arquitectura existente (hilos, colas, callbacks y sincronización) para asegurar compatibilidad y estabilidad con los scripts previos de control y captura.

Pruebas realizadas

Verificación de la correcta extracción de velocidad hacia adelante mediante proyección del vector velocidad sobre el eje forward del vehículo.
Validación del cálculo de yaw rate (ω) a partir de la velocidad angular en el eje Z.
Comprobación de la consistencia temporal entre imágenes y etiquetas usando snapshot.frame e image.frame.
Entrenamiento inicial del modelo con el nuevo dataset para confirmar convergencia de la loss en un problema de regresión continua de dos dimensiones.

Resultados preliminares

El nuevo dataset desacopla al modelo de los detalles específicos del actuador del simulador, facilitando la transferencia entre vehículos y configuraciones.
El entrenamiento con (v, ω) muestra un aprendizaje más estable que con controles crudos, especialmente en curvas y transiciones suaves.
Se sienta la base para integrar un controlador cinemático intermedio que traduzca las salidas del modelo a comandos de bajo nivel.

Próximos pasos

Implementar un controlador de ejecución (PID de velocidad + conversión ω → steer) para cerrar el loop de inferencia en CARLA.
Integrar Behavior Metrics para evaluar no solo seguimiento de carril, sino suavidad, estabilidad y seguridad del comportamiento generado.
Analizar la necesidad de normalización o clipping de las salidas (v, ω) durante inferencia para evitar comandos físicamente inviables.
Retomar pruebas de conducción autónoma completa una vez integrado el nuevo controlador.

You May Also Enjoy