Semana 9 - Lectura de papers y dataset
Índice
- Navegación autónoma de un dron para localizar un transmisor de radiofrecuencia 1.1 ANAIV: Algoritmos de navegación autónoma basados en vecindad 1.2 Navegación autónoma por aprendizaje automático
- A Reduction of Imitation Learning and Structured Prediction to No-Regret
- Obtención de datasets
Navegación autónoma de un dron para localizar un transmisor de radiofrecuencia
Encontré este TFG en el LinkedIn del departamento y me pareció interesante leerlo, ya que también trata sobre la navegación autónoma de drones con aprendizaje automático.
Además, también es interesante el enfoque de localización de radiofrecuencias, además de otros algoritmos de navegación autónoma.
- ANAIV: Algoritmos de navegación autónoma basados en vecindad
- Métodos para comandar al dron: Conjunto de funciones encargadas del movimiento.
- Métodos de tolerancia: Establecen un margen aceptable entre la posición del dron y el objetivo deseado.
- Métodos de conversión: Transforman las coordenadas entre los distintos sistemas de referencia.
- Algoritmos: Conjunto de métodos que se necesitan para llevar a cabo una tarea.
La navegación autónoma por aprendizaje automático se realiza mediante Q-learning, dado una tabla Q de estados y acciones de modo que si el dron toma una decisión, se usará un sistema de recompensas; en este caso, los estados son las posiciones del dron y el mapa de calor.
Otro enfoque interesante es la combinación de VFF junto a Q-learning para que el dron, al mismo tiempo que está buscando la radiofrecuencia, pueda esquivar obstáculos.
A Reduction of Imitation Learning and Structured Prediction to No-Regret
En el aprendizaje por imitación, es posible que no conozcamos u observemos los costos reales C(s, a) para la tarea específica. En su lugar, observamos demostraciones de expertos y buscamos acotar J(π) para cualquier función de costo C, basándonos en qué tan bien π imita la política del experto π∗.
Obtención de datasets
Una vez conseguido el piloto experto, usamos el siguiente comando para grabar los topics que necesitamos para nuestro entrenamiento:
ros2 bag record -o ros_bag_name /drone0/motion_reference/twist /drone0/sensor_measurements/frontal_camera/image_raw
Una vez grabados los datasets en distintos circuitos en ambos sentidos, cada dataset se guardó en una carpeta diferente para poder elegir qué circuito procesar.
Al cargar los datos, me di cuenta de que el ordenador se aceleraba mucho y tardaba bastante solo en leer los datos de las rosbags; un solo circuito tardaba 30 segundos. Sin embargo, si el programa leía de todas las pruebas del piloto experto, el ordenador se quedaba colgado.
Aprovechando que teníamos un ejemplo de datasets con drones en el siguiente repositorio comprobé la manera estándar en que la gente guarda sus datasets. Así se volvió más genérico el programa. Se observó cómo se guardan las imágenes en formato jpg y los labels en .txt, por lo que se siguió la misma práctica.