4 minute read

Resultados de comparación: Burbuja (autopiloto) vs Control Manual (teleoperado) usando modelo PilotNet

Métrica Burbuja (Autopiloto) Control Manual (Humano)
Distancia completada (m) 779.06 616.84
Distancia efectiva (m) 277.00 373.00
Velocidad promedio (km/h) 16.94 29.95
Velocidad máxima (km/h) 22.73 38.49
Velocidad mínima (km/h) 7.14 -0.72
Desviación posición media (m) 1.11 0.87
Desviación media por km (m/km) 4.02 2.32
Errores de posición total (m) 2462.84 856.69
Colisiones 0 0
Invasiones de carril 0 0
Suddenness velocidad (∑ dist) 0.198 0.274
Suddenness comandos (∑ dist) 0.190 0.087
Suddenness por km – velocidad 0.713 0.735
Suddenness por km – control 0.685 0.235
Suddenness por km – throttle 0.660 0.111
Suddenness por km – steer 0.076 0.157
Tiempo simulado total (s) 165 73
Tiempo real total (s) 320.12 159.16

Comparación de métricas offline: PilotNet entrenado con datasets diferentes

Dataset / Modelo Steer MSE Steer RMSE Steer MAE Throttle MSE Throttle RMSE Throttle MAE
Control manual 0.1123 0.3351 0.2249 0.1588 0.3985 0.3846
Burbuja (autopiloto) 0.2487 0.4987 0.1483 0.4067 0.6375 0.3939

MoE: desempeño al lanzar el modelo a distintas velocidades objetivo

Vel. de lanzamiento (km/h) Vel. prom. (km/h) Vel. máx. (km/h) Dist. completada (m) Dist. efectiva (m) Desv. pos. media (m) Desv. por km (m/km) Suddenness/km velocidad Suddenness/km control Suddenness/km steer Colisiones Invasiones
15 45.998 70.359 381.133 84.5 1.066 12.621 10.552 2.425 0.382 0 0
30 31.754 60.282 536.225 126.0 1.213 9.630 4.835 1.874 0.311 0 0
45 39.786 67.051 672.597 158.0 1.843 11.664 3.790 1.801 0.261 0 0
60 46.651 71.873 344.088 53.0 1.391 26.248 19.315 3.974 0.875 0 0
80 30.309 77.341 680.149 192.5 1.128 5.860 3.118 1.467 0.262 0 0
100 27.730 90.706 497.626 109.0 1.304 11.960 6.005 2.304 0.536 0 0

Modelo Monolítico: desempeño a diferentes velocidades de lanzamiento

Vel. lanzamiento (km/h) Vel. prom. (km/h) Vel. máx. (km/h) Desv. pos./km (m/km) Suddenness vel./km
15 19.36 36.67 3.18 0.93
30 45.28 63.07 6.71 2.63
45 19.92 51.65 3.30 0.91
60 35.21 60.66 2.35 1.30
80 46.10 81.12 4.45 2.16
100 45.32 105.13 3.24 2.07

Comparación MoE vs Monolítico a diferentes velocidades de lanzamiento

Vel. lanzamiento (km/h) Desv./km MoE Suddenness/km MoE Desv./km Monolítico Suddenness/km Monolítico
15 12.62 10.55 3.18 0.93
30 9.63 4.83 6.71 2.63
45 11.66 3.79 3.30 0.91
60 26.25 19.31 2.35 1.30
80 5.86 3.12 4.45 2.16
100 11.96 6.00 3.24 2.07

Resultados de comparación: Monolítico vs MoE (EfficientNetV2-S, dataset teleoperado)

  1. Evaluación Offline (Dataset teleoperado)
Modelo Steer MSE Steer RMSE Steer MAE Throttle MSE Throttle RMSE Throttle MAE
Monolítico 0.0854 0.2922 0.1650 0.2146 0.4632 0.3936
Experto – Curva 0.2213 0.4704 0.1085 0.5097 0.7139 0.3952
Experto – Recta 0.2592 0.5091 0.1214 0.4886 0.6990 0.3802

  1. Evaluación Online (Simulación con Behavior Metrics)
Métrica Monolítico (EfficientNetV2-S) MoE (EfficientNetV2-S)
Distancia completada (m) 780.14 788.81
Distancia efectiva (m) 256.00 141.50
% completado 0.0169 0.0169
Velocidad promedio (km/h) 44.87 53.34
Velocidad máxima (km/h) 66.77 77.77
Velocidad mínima (km/h) 25.19 16.69
Desviación posición media (m) 0.873 1.103
Desviación media por km (m/km) 3.41 7.79
Errores de posición total (m) 733.55 787.34
Colisiones 0 0
Invasiones de carril 0 0
Suddenness velocidad (∑ dist) 0.489 0.748
Suddenness comandos (∑ dist) 0.139 0.181
Suddenness por km – velocidad 1.91 5.28
Suddenness por km – control 0.543 1.28
Suddenness por km – throttle 0.450 1.18
Suddenness por km – steer 0.200 0.212
Tiempo simulado total (s) 63 53
Tiempo real total (s) 273.67 122.06

Pruebas de robustez (MoE)

Caso Dist. completada (m) Dist. efectiva (m) Vel. prom. (km/h) Vel. máx. (km/h) Desv./km (m/km) Suddenness/km (vel.) Suddenness/km (control) Suddenness/km (steer) Colisiones Invasiones
1 192.07 41.0 21.81 40.14 34.13 10.06 6.55 1.47 0 0
2 238.35 56.0 21.74 52.79 50.42 7.87 3.65 1.41 0 0
3 222.06 115.5 12.47 24.43 25.25 2.17 2.77 0.75 0 0
4 188.99 46.5 29.89 55.62 41.43 11.16 5.81 1.71 0 0

Pruebas de robustez (Monolítico)

Caso Dist. completada (m) Dist. efectiva (m) Vel. prom. (km/h) Vel. máx. (km/h) Desv./km (m/km) Suddenness/km (vel.) Suddenness/km (control) Suddenness/km (steer) Colisiones Invasiones
1 89.58 38.5 13.56 35.02 50.24 6.75 6.21 3.17 0 0
2 71.94 22.5 12.67 19.15 107.66 13.75 9.46 4.46 0 0
3 63.06 6.0 10.95 34.02 1587.68 46.37 31.71 17.44 0 0
4 71.19 17.0 18.28 27.13 162.82 25.82 14.40 6.83 0 0

Resumen de resultados

  • PilotNet (dataset): control manual con menor desviación media, menor error por km y mayor suavidad; la burbuja recorre más distancia pero a menor velocidad y con mayor error.

  • PilotNet (offline): el dataset teleoperado mejora throttle y steer en MSE/RMSE; la burbuja obtiene menor Steer MAE.

  • MoE vs Monolítico (lanzamiento por velocidad): el monolítico presenta menores desviaciones y suddenness en la mayoría de velocidades; el MoE es más variable (peor a 60 km/h, mejor a 80 km/h).

  • EfficientNetV2-S (online): el monolítico muestra menor desviación media (0.873 m vs. 1.103 m) y menor error por km (3.41 vs. 7.79); el MoE alcanza mayores velocidades.

  • Robustez: el MoE logra recuperaciones aceptables en algunos casos pero con alta variabilidad; el monolítico exhibe desviaciones extremas en ciertos escenarios adversos.