En el proyecto AutoTrust, financiado por el Gobierno Vasco (programa Elkartek 2023) y liderado por Vicomtech, se trabaja en el desarrollo de funcionalidades confiables para CCAM (Connected, Cooperative and Automated Mobility). El principal objetivo del proyecto es investigar y proponer metodologías prácticas de IA que proporcionen confiabilidad a los sistemas de IA.
Los simuladores son clave en el desarrollo de sistemas confiables, ya que permiten generar grandes volúmenes de datos de forma eficiente, así como evaluar una funcionalidad ante una misma situación de forma iterativa bajo diferentes escenas para analizar su comportamiento. Para que los resultados de estas pruebas sean representativos, es necesario que el sistema se comporte igual o de forma similar ante datos reales y simulados, lo que implica el análisis de la posible divergencia que puede haber entre los diferentes dominios. La diferencia que ambos dominios (real y simulado) suponen en el funcionamiento de un algoritmo es conocido como brecha de dominio (domain gap).
En este contexto, Vicomtech está investigando cómo identificar la brecha, así como reducirla, para los diferentes sensores utilizados en automoción, como cámaras y LiDARs. Los primeros resultados obtenidos en esta investigación se han recogido en el artículo científico “Analysis of point cloud domain gap effects for 3D object detection Evaluation”, el cual ha sido aceptado y será presentado en el congreso VISAPP 2024 (19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications). En esta investigación, concretamente, se aborda la brecha de dominio entre datos LiDAR reales y datos sintéticos generados mediante el simulador de automoción CARLA.
El desarrollo de sistemas de conducción autónomos basados en el sensor LiDAR depende en gran medida de la disponibilidad de datos de calidad. Sin embargo, obtener una cantidad sustancial de dichos datos supone un gran desafío. Para superar esta limitación, estudios recientes están aprovechando los avances en motores de simulación realistas, como CARLA, que ha supuesto un gran avance en la generación de datos de LiDAR sintéticos que se parezcan a los capturados en el mundo real. Sin embargo, estos datos están lejos de ser idénticos a los datos reales.
En el estudio presentado, Vicomtech estudia la brecha de dominio entre datos LiDAR reales y datos sintéticos en el contexto de la detección de objetos 3D. Para ello, primero se entrenan modelos de aprendizaje profundo (deep learning) para la detección de objetos utilizando datos reales. Posteriormente, esos modelos se evalúan rigurosamente utilizando datos sintéticos generados en CARLA. Cuantificando las discrepancias entre el desempeño del modelo al usar datos reales y sintéticos, el presente estudio muestra que existe una brecha de dominio entre los dos tipos de datos, la cual no afecta igual a las arquitecturas de diferentes modelos del estado del arte.
Finalmente, se propone un método de procesamiento de datos sintéticos para reducir la brecha de dominio. Mediante la investigación presentada en el artículo y la futura planeada en el proyecto AutoTrust, se tiene como objetivo contribuir a mejorar el uso de datos simulados para garantizar la evaluación y el desarrollo sistemas de conducción autónoma confiables.
Figura 1. Nubes de puntos capturadas por un sensor LiDAR simuladas con CARLA y diferentes objetos 3D.