We benchmarked 18 LLMs on OCR (7k+ calls) — cheaper/old models oftentimes win. Full dataset + framework open-sourced. [R]
Forscher haben 18 LLMs für OCR getestet und festgestellt, dass günstigere und ältere Modelle oft die Genauigkeit von Flaggschiff-Modellen zu einem Bruchteil der Kosten erreichen oder übertreffen. Sie haben ihren Datensatz und das Benchmarking-Framework als Open Source veröffentlicht.
