← heapsort-ai

OCR

21 items

ARTICLE↑ trendingHacker News (AI)·15d ago

Show HN: Unsiloed AI – #1 on olmOCR-Bench

UnSiloed Parser v3.1 achieved the #1 rank on olmOCR-Bench, outperforming 18 other OCR services including advanced AI models. The evaluation, conducted across 1,403 PDFs and 8,413 unit tests, demonstrated its capability to handle complex real-world document challenges like intricate tables and multi-column layouts.

42
ARTICLE↑ trendingReddit r/MachineLearning·4/9/2026

Detecting mirrored selfie images: OCR the best way? [D]

O usuário busca um método eficaz para detectar texto invertido em selfies antes de passá-los para modelos de Visão-Linguagem (VLM) ou extratores de embedding facial, que são insensíveis a essa inversão devido ao treinamento com dados aumentados. Sua ideia é usar OCR (EasyOCR) para comparar a pontuação de leitura de texto normal versus espelhado, questionando se esta é a melhor abordagem ou se existe uma solução de modelo menor e mais inteligente.

40
CASE↑ trendingReddit r/MachineLearning·4/10/2026

[D] Large scale OCR [D]

Um usuário busca a forma mais econômica e rápida (1 semana) de realizar OCR em 50 milhões de páginas de documentos legais, focando apenas no texto e sem se preocupar com o layout. Este é um desafio prático de processamento de documentos em larga escala com restrições de tempo e custo.

36
RESEARCHarXiv CS.CL·5/6/2026

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

MedStruct-S is a new benchmark for semi-structured information extraction from OCR-derived clinical reports, addressing challenges like heterogeneous key representations and OCR noise. It aims to evaluate model robustness in real-world settings for key discovery, key-conditioned QA, and key-value pair extraction.

27