Week 27 – Control intermedio con PID, lectura de CAT-K y preparación para datasets humanos
Week 27 – Control intermedio con PID, lectura de CAT-K y preparación para datasets humanos
Lectura y análisis del artículo (CAT-K)
Se estudió en detalle el artículo Closest Among Top-K (CAT-K), enfocado en mitigar el covariate shift entre el entrenamiento open-loop y la ejecución closed-loop en simulación de tráfico.
El paper destaca que:
- El entrenamiento puramente open-loop con ground truth (GT) conduce a errores acumulativos durante la ejecución.
- Las técnicas de data augmentation que ignoran la política aprendida no generan estados representativos del despliegue real.
- El entrenamiento closed-loop es clave para mejorar estabilidad y realismo, siempre que se preserve una señal de supervisión válida.
La idea central de CAT-K —mantener los rollouts dentro del soporte de la política mientras se permanece cercano al GT— refuerza la decisión de utilizar un espacio de acción cinemático (v, ω) y un controlador intermedio, desacoplando percepción y control.
Controlador intermedio PID (v, ω → steer, throttle, brake)
Se diseñó e implementó un controlador intermedio en ROS2 que convierte las salidas del modelo (v, ω) en comandos de bajo nivel para CARLA.
- El control longitudinal se realiza mediante un PID de velocidad que traduce el error entre velocidad deseada y medida en comandos de throttle y brake.
- El control lateral convierte la velocidad angular (ω) en steering utilizando un modelo cinemático tipo bicicleta.
Aún no esta funcionando completamente pero va en proceso
Estado actual del sistema
Avances consolidados
- Cambio completo del espacio de acción a velocidad lineal y angular (v, ω).
- Implementación funcional del controlador PID intermedio en ROS2.
- Integración del volante y pedales para recolección de datos del conductor experto.
Problemas
- Persisten dificultades en la integración directa de la red neuronal con el controlador PID:
- ruido en la predicción de ω genera oscilaciones en el steering,
- algunas salidas del modelo no son físicamente viables,
- el comportamiento final es sensible al ajuste de ganancias del PID.
Actualmente se trabaja en el filtrado, normalización de las salidas del modelo, así como en el ajuste fino del controlador Y la integración con ROS2.
Próximos pasos
- Completar la integración red → controlador PID y cerrar el loop de conducción autónoma.
- Incorporar Behavior Metrics para evaluar estabilidad, suavidad y seguridad del comportamiento.
- Analizar estrategias de closed-loop fine-tuning inspiradas en CAT-K sobre el pipeline actual.
- Reanudar pruebas de conducción autónoma prolongada con el nuevo esquema de control.