RESEARCH28
GIST: Multimodal Knowledge Extraction and Spatial Grounding via Intelligent Semantic Topology
arXiv CS.AI·20 avril 2026
GIST introduit un pipeline d'extraction de connaissances multimodal pour l'ancrage spatial dans des environnements complexes, transformant les nuages de points mobiles en topologies de navigation sémantiquement annotées. Il distille les scènes en cartes d'occupation 2D, extrait les agencements topologiques et superpose une couche sémantique légère pour aider l'IA incarnée et les humains.
Lire l'original ↗