← heapsort-ai

Image processing

19 items

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Detecting mirrored selfie images: OCR the best way? [D]

O usuário busca um método eficaz para detectar texto invertido em selfies antes de passá-los para modelos de Visão-Linguagem (VLM) ou extratores de embedding facial, que são insensíveis a essa inversão devido ao treinamento com dados aumentados. Sua ideia é usar OCR (EasyOCR) para comparar a pontuação de leitura de texto normal versus espelhado, questionando se esta é a melhor abordagem ou se existe uma solução de modelo menor e mais inteligente.

40
DOCDEV.to AI·10/05/2026

How I cut speech-bubble retries from 70% to 0% with 200 lines of Pillow code

L'auteur a considérablement réduit les tentatives de génération d'images IA avec du texte illisible dans les bulles de dialogue en transférant la typographie à une étape de post-traitement déterministe. Cela a impliqué que l'IA dessine des bulles vides, puis utilise Pillow et OpenCV pour ajouter du texte lisible, atteignant un taux de réessai nul pour les problèmes de texte.

28
ARTICLEDEV.to AI·il y a 26j

Browser AI vs Cloud APIs for Image Processing

Cet article compare le traitement d'images basé sur le cloud avec le traitement d'images IA côté client, explorant les compromis rencontrés lors de la création d'un outil open-source de suppression d'arrière-plan basé sur le navigateur. Il met en évidence comment la suppression d'arrière-plan et d'autres fonctions d'IA peuvent être exécutées localement sur l'appareil de l'utilisateur, offrant un ensemble différent d'avantages et d'inconvénients par rapport aux API cloud.

27
DOCDEV.to AI·il y a 25j

Building a License Plate Recognition Engine in C++ — Part 2: Grayscale Image Preprocessing and Local Contrast Edge Detection

Cet article, la deuxième partie d'une série, détaille l'étape de prétraitement d'image pour la construction d'un moteur de reconnaissance de plaques d'immatriculation (LPR) en C++. Il aborde la génération d'image intégrale, l'analyse du contraste local et l'extraction de carte des contours pour améliorer les régions susceptibles de contenir des caractères de plaques d'immatriculation pour les systèmes en temps réel.

27
ARTICLEDEV.to AI·21/04/2026

Convert Images into Presentations Automatically Using AI

Le contenu décrit un flux de travail basé sur l'IA pour convertir automatiquement les informations visuelles d'images, telles que des captures d'écran et des diagrammes, en présentations structurées. Ce processus vise à simplifier l'analyse manuelle et la création de diapositives, nécessitant des images claires et de haute qualité pour des résultats optimaux.

26
ARTICLEDEV.to AI·24/04/2026

Dialing in the Perfect Mood: Mastering Photo Lighting with AI Relighting

Le texte décrit comment le rééclairage par IA optimise la photographie de produits pour le commerce électronique, transformant des photos plates en images dynamiques et texturées. Cette capacité d'IA ajuste intelligemment la source de lumière pour modifier l'ambiance, la direction et l'intensité, ce qui permet de gagner du temps et d'assurer la cohérence du flux de travail.

26
ARTICLEDEV.to AI·21/04/2026

Common Limitations of Image Processing Metrics: A Picture Story

Ce contenu analyse les limitations courantes des métriques de traitement d'image, utilisant des exemples visuels pour illustrer comment les méthodes d'évaluation traditionnelles peuvent ne pas toujours s'aligner avec la perception humaine ou refléter précisément la performance de l'algorithme. Il souligne les défis de l'évaluation objective de la qualité et de l'efficacité du traitement d'image.

25