heapsort
RESEARCH27

Operationalizing Document AI: A Microservice Architecture for OCR and LLM Pipelines in Production

arXiv CS.AI·20 mai 2026

Cet article présente une architecture de microservices pour l'opérationnalisation des pipelines de compréhension de documents, combinant l'OCR et les grands modèles de langage pour l'extraction de champs structurés à l'échelle de la production. Il détaille les décisions de conception clés, telles que le traitement asynchrone et la mise à l'échelle indépendante, notant la prédominance de l'OCR dans la latence de bout en bout.

Lire l'original