Soy ingeniero en robótica, apasionado por los vehículos autónomos y el desarrollo de tecnologías inteligentes que impacten positivamente el mundo real.
Week 29 – Generación de dataset de recuperación humana con DAgger y perturbaciones controladas
Trabajo realizado
Se diseñó e implementó un pipeline de recolección de datos basado en DAgger (Dataset Aggregation)** enfocado exclusivamente en comportamientos de recuperación ante desviaciones inducidas.
Se desarrolló un script de control en CARLA que:
introduce perturbaciones controladas en el comando de steering,
ejecuta la simulación en closed-loop,
separa explícitamente las fases de ruido y recuperación
Las perturbaciones consisten en:
ruido discreto en el comando de dirección (steer),
duración breve (≈ 1 s),
activación automática cada 20 s de tiempo de simulación,
exclusión completa de estos frames del dataset.
Se implementó una política de grabación recovery-only, donde:
no se registran muestras durante la aplicación del ruido,
solo se guardan muestras durante la ventana de recuperación posterior,
las etiquetas corresponden exclusivamente a la acción del experto humano.
Se validó visualmente y en tiempo real:
la correcta exclusión de frames con ruido,
la coherencia temporal entre perturbación y recuperación,
la naturalidad de las maniobras humanas de corrección.
Se integró el pipeline con el sistema de recording/replay de CARLA, permitiendo reproducibilidad completa del escenario, manteniendo el filtrado selectivo del dataset.
Estado actual del sistema
Avances
Pipeline funcional de DAgger enfocado en recuperación, alineado con prácticas estándar de imitation learning robusto.
Dataset compuesto exclusivamente por trayectorias correctivas humanas, evitando sesgos de conducción nominal.
Separación explícita y controlada de:
fase de perturbación (no grabada),
fase de recuperación (grabada).
Mecanismo automático y determinista de inyección de ruido en steering.
Infraestructura de logging robusta:
imágenes RGB sincronizadas,
etiquetas humanas limpias,
metadatos suficientes para análisis posterior.
Validación empírica de que el dataset captura estados fuera de distribución, relevantes para entrenamiento en closed-loop.
Ejemplo de secuencia de recuperación humana tras perturbación controlada en steering