1 minute read

Week 26 – Cambio de nivel de abstracción en acciones y entrenamiento con velocidades

Avances

  • Se realizó un cambio en el nivel de abstracción de las acciones del agente, pasando de comandos directos del simulador (steer, throttle, brake) a un espacio de acción más físico y generalizable basado en velocidad lineal (v) y velocidad angular (ω).
  • Se modificaron los scripts de grabación de dataset para registrar (v, ω) directamente desde el estado cinemático del vehículo en CARLA, manteniendo sincronización por frame con las imágenes RGB.
  • Se adaptó el pipeline de entrenamiento (Dataset, modelo y head de regresión) para aprender el nuevo espacio de acción (v_mps, omega_rps) usando MobileNetV2 con transfer learning.
  • Se mantuvo la arquitectura existente (hilos, colas, callbacks y sincronización) para asegurar compatibilidad y estabilidad con los scripts previos de control y captura.

Pruebas realizadas

  • Verificación de la correcta extracción de velocidad hacia adelante mediante proyección del vector velocidad sobre el eje forward del vehículo.
  • Validación del cálculo de yaw rate (ω) a partir de la velocidad angular en el eje Z.
  • Comprobación de la consistencia temporal entre imágenes y etiquetas usando snapshot.frame e image.frame.
  • Entrenamiento inicial del modelo con el nuevo dataset para confirmar convergencia de la loss en un problema de regresión continua de dos dimensiones.

Resultados preliminares

  • El nuevo dataset desacopla al modelo de los detalles específicos del actuador del simulador, facilitando la transferencia entre vehículos y configuraciones.
  • El entrenamiento con (v, ω) muestra un aprendizaje más estable que con controles crudos, especialmente en curvas y transiciones suaves.
  • Se sienta la base para integrar un controlador cinemático intermedio que traduzca las salidas del modelo a comandos de bajo nivel.

Próximos pasos

  • Implementar un controlador de ejecución (PID de velocidad + conversión ω → steer) para cerrar el loop de inferencia en CARLA.
  • Integrar Behavior Metrics para evaluar no solo seguimiento de carril, sino suavidad, estabilidad y seguridad del comportamiento generado.
  • Analizar la necesidad de normalización o clipping de las salidas (v, ω) durante inferencia para evitar comandos físicamente inviables.
  • Retomar pruebas de conducción autónoma completa una vez integrado el nuevo controlador.
New Data Vel & Omega
Velocity and Omega.