RESEARCH28

GIST: Multimodal Knowledge Extraction and Spatial Grounding via Intelligent Semantic Topology

arXiv CS.AI·20 avril 2026

GIST introduit un pipeline d'extraction de connaissances multimodal pour l'ancrage spatial dans des environnements complexes, transformant les nuages de points mobiles en topologies de navigation sémantiquement annotées. Il distille les scènes en cartes d'occupation 2D, extrait les agencements topologiques et superpose une couche sémantique légère pour aider l'IA incarnée et les humains.

multimodal AI navigation spatial AI computer vision robotics

Lire l'original ↗