Week 4 - Modelo Nvidia -PilotNet
Entrenamiento de la Red PilotNet
La red neuronal PilotNet fue entrenada mediante la biblioteca TensorFlow 2.0 utilizando un conjunto de datos compuesto por 9000 imágenes recopiladas del simulador CARLA. Cada imagen fue etiquetada con su respectivo ángulo de giro. Para prevenir problemas de sobreajuste, se implementó un balanceo de datos eliminando ángulos cercanos a cero.
Como parte del preprocesamiento, las imágenes fueron recortadas a una dimensión de 200x66x3, enfocándose en la región de interés para permitir que el modelo se concentre en información esencial de manera más efectiva.
El entrenamiento se llevó a cabo con una tasa de aprendizaje de 0.0001 durante 70 épocas, dividiendo los datos en un 70% para entrenamiento y un 30% para validación.
Para mejorar la capacidad de generalización del modelo y evitar sobreajuste, se empleó la biblioteca Albumentations, generando 64,000 imágenes adicionales mediante técnicas como HorizontalFlip() y ColorJitter().
La métrica de evaluación utilizada incluyó el error cuadrático medio (MSE) y el error absoluto medio (MAE), que cuantificaron la discrepancia entre las etiquetas reales y las predicciones del modelo.
Durante el análisis, se compararon detalladamente las etiquetas reales con las predicciones, revelando un rendimiento general sólido con pequeños errores en la mayoría de las predicciones. Sin embargo, en una imagen específica, se observó un error más significativo, indicando la incapacidad del modelo para tomar decisiones acertadas en situaciones donde la referencia del carril no estaba clara, como la falta de líneas separadoras o andenes. Como estrategia para mejorar el desempeño del piloto, se optó por incorporar más grados de libertad al modelo y mejorar los filtros utilizados en el aumento de datos.