Week 11 - Etiquetado de imagenes
Etiquetado manual
Debido a que el enfoque de detección de carriles implementado utilizando visión computacional clásica no demostró la robustez deseada, se optó por generar un dataset de manera manual. Este proceso involucró el etiquetado manual de un conjunto de datos utilizando la herramienta Labelme. Se crearon etiquetas para tres clases principales: left_lane (carril izquierdo), right_lane (carril derecho) y background (fondo).
Entrenamiento
Durante el entrenamiento del modelo de detección de carriles, se utilizó EfficientNet-B0 como encoder con pesos pre-entrenados en ImageNet y una función de activación Softmax2D. Se implementó una arquitectura FPN para aprovechar las características a múltiples escalas. La optimización del modelo se realizó con la función de pérdida MultiDiceLoss a lo largo de cinco épocas de entrenamiento. El conjunto de datos consistió en 3000 imágenes de entrenamiento y 120 imágenes de prueba, con la aplicación de técnicas de aumento de datos mediante Albumentations para mejorar la generalización del modelo. Este enfoque permitió desarrollar un modelo robusto capaz de detectar con precisión los carriles izquierdo.
Pruebas con el simulador CARLA
video 1
video 2