1 minute read

Week 29 – Generación de dataset de recuperación humana con DAgger y perturbaciones controladas

Trabajo realizado

  • Se diseñó e implementó un pipeline de recolección de datos basado en DAgger (Dataset Aggregation)** enfocado exclusivamente en comportamientos de recuperación ante desviaciones inducidas.
  • Se desarrolló un script de control en CARLA que:
    • introduce perturbaciones controladas en el comando de steering,
    • ejecuta la simulación en closed-loop,
    • separa explícitamente las fases de ruido y recuperación
  • Las perturbaciones consisten en:
    • ruido discreto en el comando de dirección (steer),
    • duración breve (≈ 1 s),
    • activación automática cada 20 s de tiempo de simulación,
    • exclusión completa de estos frames del dataset.
  • Se implementó una política de grabación recovery-only, donde:
    • no se registran muestras durante la aplicación del ruido,
    • solo se guardan muestras durante la ventana de recuperación posterior,
    • las etiquetas corresponden exclusivamente a la acción del experto humano.
  • Se validó visualmente y en tiempo real:
    • la correcta exclusión de frames con ruido,
    • la coherencia temporal entre perturbación y recuperación,
    • la naturalidad de las maniobras humanas de corrección.
  • Se integró el pipeline con el sistema de recording/replay de CARLA, permitiendo reproducibilidad completa del escenario, manteniendo el filtrado selectivo del dataset.

Estado actual del sistema

Avances

  • Pipeline funcional de DAgger enfocado en recuperación, alineado con prácticas estándar de imitation learning robusto.
  • Dataset compuesto exclusivamente por trayectorias correctivas humanas, evitando sesgos de conducción nominal.
  • Separación explícita y controlada de:
    • fase de perturbación (no grabada),
    • fase de recuperación (grabada).
  • Mecanismo automático y determinista de inyección de ruido en steering.
  • Infraestructura de logging robusta:
    • imágenes RGB sincronizadas,
    • etiquetas humanas limpias,
    • metadatos suficientes para análisis posterior.
  • Validación empírica de que el dataset captura estados fuera de distribución, relevantes para entrenamiento en closed-loop.

Ejemplo de recuperación tras perturbación en steer
Ejemplo de secuencia de recuperación humana tras perturbación controlada en steering