notch
ARTICLE↑ trending40

Detecting mirrored selfie images: OCR the best way? [D]

Reddit r/MachineLearning·9 de abril de 2026

O usuário busca um método eficaz para detectar texto invertido em selfies antes de passá-los para modelos de Visão-Linguagem (VLM) ou extratores de embedding facial, que são insensíveis a essa inversão devido ao treinamento com dados aumentados. Sua ideia é usar OCR (EasyOCR) para comparar a pontuação de leitura de texto normal versus espelhado, questionando se esta é a melhor abordagem ou se existe uma solução de modelo menor e mais inteligente.

AI modelsimage-processingVision-Language Modelscomputer-visionOCR
Ler original