We benchmarked 18 LLMs on OCR (7k+ calls) — cheaper/old models oftentimes win. Full dataset + framework open-sourced. [R]
Investigadores realizaron un benchmark de 18 LLMs para OCR, descubriendo que los modelos más baratos y antiguos a menudo igualan o superan la precisión de los modelos insignia a una fracción del costo. Han hecho de código abierto su conjunto de datos y framework de benchmarking.
