Eusko Jaurlaritzak finantzatutako AutoTrust proiektuan (Elkartek 2023 programa), Vicomtechek gidatuta, CCAMentzat (Connected, Cooperative and Automated Mobility) fidagarriak diren funtzionalitateak garatzen lan egiten da. Proiektuaren helburu nagusia IAren sistemei fidagarritasuna emango dieten metodologia praktikoak ikertzea eta proposatzea da.

Simulagailuak funtsezkoak dira sistema fidagarriak garatzeko; izan ere, aukera ematen dute datu-bolumen handiak modu eraginkorrean sortzeko, bai eta egoera beraren aurrean funtzionaltasun bat modu iteratiboan ebaluatzeko ere, hainbat eszenatan, haien portaera aztertzeko. Proba horien emaitzak adierazgarriak izan daitezen, sistemak berdin edo antzera jokatu behar du datu erreal eta simulatuen aurrean, eta horrek esan nahi du domeinu desberdinen artean egon daitekeen dibergentzia aztertu behar dela. Bi domeinuek (benetakoa eta simulatua) algoritmo baten funtzionamenduan eragiten duten aldea domeinu-arraila (domain gap) bezala ezagutzen da.

Testuinguru horretan, Vicomtech ikertzen ari da nola identifikatu arrakala, bai eta murriztu ere, automobilgintzan erabiltzen diren sentsoreetarako, hala nola kamerak eta LiDARs. Ikerketa honetan lortutako lehen emaitzak “Analysis of point cloud domain gap effects for 3D object detection Evaluation” artikulu zientifikoan jaso dira. Artikulu hori onartu da eta VISAPP 2024 kongresuan aurkeztuko da (19th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications). Ikerketa honetan, zehazki, LiDAR datu errealen eta CARLA automozio simulagailuaren bidez sortutako datu sintetikoen arteko domeinu-arrakala jorratzen da.

LiDAR sentsorean oinarritutako gidatze-sistema autonomoen garapena kalitate-datuen eskuragarritasunaren mende dago neurri handi batean. Hala ere, datu horien kopuru handi bat lortzea erronka handia da. Muga hori gainditzeko, ikerketa berriak simulazio-motor errealistetan egindako aurrerapenak aprobetxatzen ari dira, hala nola CARLA, eta horrek aurrerapen handia ekarri du mundu errealean harrapatutakoen antza duten LiDAR sintetikoen datuen sorreran. Hala ere, datu horiek datu errealen berdinak izatetik urrun daude.

Aurkeztutako azterlanean, Vicomtechek LiDAR datu errealen eta datu sintetikoen arteko domeinu-arrakala aztertzen du, 3D objektuen detekzioaren testuinguruan. Horretarako, lehenik eta behin, sakoneko ikaskuntzako ereduak (deep learning) entrenatzen dira, datu errealak erabiliz objektuak detektatzeko. Ondoren, eredu horiek zorrotz ebaluatzen dira, CARLAn sortutako datu sintetikoak erabiliz. Datu errealak eta sintetikoak erabiltzean ereduaren jardunaren artean dauden desadostasunak kuantifikatuz, azterlan honek erakusten du bi datu moten arteko domeinu-arrakala dagoela, eta horrek ez diela berdin eragiten artearen egoeraren eredu desberdinen arkitekturei.

Azkenik, datu sintetikoak prozesatzeko metodo bat proposatzen da, domeinu-arrakala murrizteko. Artikuluan aurkeztutako ikerketaren eta AutoTrust proiektuan aurreikusitako ikerketaren bidez, datu simulatuen erabilera hobetzen laguntzea da helburua, gidatzeko sistema autonomo fidagarrien ebaluazioa eta garapena bermatzeko.

1. irudia. LiDAR sentsore batek harrapatutako puntu-hodeiak, CARLArekin eta 3D objektu desberdinekin simulatuak.