1 minute read

Week 27 – Control intermedio con PID, lectura de CAT-K y preparación para datasets humanos

Lectura y análisis del artículo (CAT-K)

Se estudió en detalle el artículo Closest Among Top-K (CAT-K), enfocado en mitigar el covariate shift entre el entrenamiento open-loop y la ejecución closed-loop en simulación de tráfico.

El paper destaca que:

  • El entrenamiento puramente open-loop con ground truth (GT) conduce a errores acumulativos durante la ejecución.
  • Las técnicas de data augmentation que ignoran la política aprendida no generan estados representativos del despliegue real.
  • El entrenamiento closed-loop es clave para mejorar estabilidad y realismo, siempre que se preserve una señal de supervisión válida.

La idea central de CAT-K —mantener los rollouts dentro del soporte de la política mientras se permanece cercano al GT— refuerza la decisión de utilizar un espacio de acción cinemático (v, ω) y un controlador intermedio, desacoplando percepción y control.


Controlador intermedio PID (v, ω → steer, throttle, brake)

Se diseñó e implementó un controlador intermedio en ROS2 que convierte las salidas del modelo (v, ω) en comandos de bajo nivel para CARLA.

  • El control longitudinal se realiza mediante un PID de velocidad que traduce el error entre velocidad deseada y medida en comandos de throttle y brake.
  • El control lateral convierte la velocidad angular (ω) en steering utilizando un modelo cinemático tipo bicicleta.

Aún no esta funcionando completamente pero va en proceso


Estado actual del sistema

Avances consolidados

  • Cambio completo del espacio de acción a velocidad lineal y angular (v, ω).
  • Implementación funcional del controlador PID intermedio en ROS2.
  • Integración del volante y pedales para recolección de datos del conductor experto.

Problemas

  • Persisten dificultades en la integración directa de la red neuronal con el controlador PID:
    • ruido en la predicción de ω genera oscilaciones en el steering,
    • algunas salidas del modelo no son físicamente viables,
    • el comportamiento final es sensible al ajuste de ganancias del PID.

Actualmente se trabaja en el filtrado, normalización de las salidas del modelo, así como en el ajuste fino del controlador Y la integración con ROS2.


Próximos pasos

  • Completar la integración red → controlador PID y cerrar el loop de conducción autónoma.
  • Incorporar Behavior Metrics para evaluar estabilidad, suavidad y seguridad del comportamiento.
  • Analizar estrategias de closed-loop fine-tuning inspiradas en CAT-K sobre el pipeline actual.
  • Reanudar pruebas de conducción autónoma prolongada con el nuevo esquema de control.