Week 81 - Métrica reward (centrado a la calzada)
Métrica reward (centrado a la calzada) — Validación fuera de BehaviorMetrics
Métrica reward (centrado a la calzada) — Validación fuera de BehaviorMetrics
Caso canónico — Comparación Burbuja vs DAgger (burbuja 68% + 32% DAgger puro)
CASO CANÓNICO: Burbuja vs DAgger
Caso Entrenamiento Distancia completada (m) Distancia efectiva (m) Desv. pos. media (m) Desv. pos. / km Co...