RESEARCHarXiv CS.CL·vor 6T
MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A
MM-BizRAG schlägt einen direkten Ansatz für die multimodale, abruf-erweiterte Generierung in Unternehmens-Q&A vor, der strukturierte Informationen in komplexen Dokumenten explizit behandelt. Es verwendet eine dokumentstruktur-bewusste Aufteilung und orientierungsspezifische Aufnahmepipelines, um verschiedene Dokumenttypen besser zu verarbeiten.
29