We benchmarked 18 LLMs on OCR (7k+ calls) — cheaper/old models oftentimes win. Full dataset + framework open-sourced. [R]
Des chercheurs ont comparé 18 LLM pour l'OCR, constatant que les modèles moins chers et plus anciens égalent ou surpassent souvent la précision des modèles phares à une fraction du coût. Ils ont open-sourcé leur ensemble de données et leur framework de benchmarking.
