Image processing

19 items

ARTICLE↑ trendingReddit r/LocalLLaMA·22/04/2026

Local manga translator with LLM build-in, written in Rust with llama.cpp integration

Ce projet est un traducteur de mangas et d'images, écrit en Rust, qui utilise la détection d'objets, l'OCR visuel basé sur les LLM, l'analyse de mise en page et des modèles d'inpainting. Il intègre llama.cpp pour le support des LLM locaux comme Gemma et Qwen, offrant un pipeline performant et facile à utiliser.

Open Source Image processing Rust OCR

Local manga translator with LLM build-in, written in Rust with llama.cpp integration

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Detecting mirrored selfie images: OCR the best way? [D]

O usuário busca um método eficaz para detectar texto invertido em selfies antes de passá-los para modelos de Visão-Linguagem (VLM) ou extratores de embedding facial, que são insensíveis a essa inversão devido ao treinamento com dados aumentados. Sua ideia é usar OCR (EasyOCR) para comparar a pontuação de leitura de texto normal versus espelhado, questionando se esta é a melhor abordagem ou se existe uma solução de modelo menor e mais inteligente.

AI models Image processing Vision-Language Models computer vision

RESEARCHDEV.to AI·08/04/2026

An All-in-One Network for Dehazing and Beyond

Este conteúdo explora uma rede neural unificada projetada para remover neblina de imagens e potencialmente realizar outras tarefas de processamento de imagem. Aborda soluções avançadas em visão computacional e inteligência artificial.

Image processing deep learning computer vision Dehazing

RESEARCHDEV.to AI·12/04/2026

An Overview of Melanoma Detection in Dermoscopy Images Using Image Processingand Machine Learning

Ce contenu présente un aperçu de la détection du mélanome dans les images de dermoscopie. Il explore l'application des techniques de traitement d'image et d'apprentissage automatique pour améliorer le diagnostic et l'analyse dans ce domaine médical.

Image processing Dermoscopy machine learning AI

DOCDEV.to AI·10/05/2026

How I cut speech-bubble retries from 70% to 0% with 200 lines of Pillow code

L'auteur a considérablement réduit les tentatives de génération d'images IA avec du texte illisible dans les bulles de dialogue en transférant la typographie à une étape de post-traitement déterministe. Cela a impliqué que l'IA dessine des bulles vides, puis utilise Pillow et OpenCV pour ajouter du texte lisible, atteignant un taux de réessai nul pour les problèmes de texte.

Image processing AI generation Stable Diffusion computer vision

ARTICLEDEV.to AI·23/04/2026

BiRefNet vs rembg vs U2Net: Which Background Removal Model Actually Works in Production?

Cet article compare les performances en production des modèles de suppression d'arrière-plan BiRefNet, rembg et U2Net, soulignant que les différences sont bien plus importantes que ne le suggèrent les benchmarks. Il détaille les cas d'échec brutaux et distincts de chaque modèle appliqué à grande échelle.

AI models Production AI Image processing Benchmarking

ARTICLEDEV.to AI·25/04/2026

Building a Free Instagram Editor with Svelte 5, WASM, & Llama 3.1

L'auteur partage le parcours technique de la création de SMM Turbo, un éditeur gratuit de carrousels Instagram basé sur le navigateur. Il utilise Svelte 5, WASM pour la suppression d'arrière-plan et Llama 3.1 via l'API Groq, en soulignant une approche unique de manipulation directe du DOM plutôt que de Canvas pour le rendu.

Image processing WebAssembly Svelte AI

ARTICLEDEV.to AI·il y a 26j

Browser AI vs Cloud APIs for Image Processing

Cet article compare le traitement d'images basé sur le cloud avec le traitement d'images IA côté client, explorant les compromis rencontrés lors de la création d'un outil open-source de suppression d'arrière-plan basé sur le navigateur. Il met en évidence comment la suppression d'arrière-plan et d'autres fonctions d'IA peuvent être exécutées localement sur l'appareil de l'utilisateur, offrant un ensemble différent d'avantages et d'inconvénients par rapport aux API cloud.

cloud APIs Open Source Image processing AI

DOCDEV.to AI·il y a 25j

Building a License Plate Recognition Engine in C++ — Part 2: Grayscale Image Preprocessing and Local Contrast Edge Detection

Cet article, la deuxième partie d'une série, détaille l'étape de prétraitement d'image pour la construction d'un moteur de reconnaissance de plaques d'immatriculation (LPR) en C++. Il aborde la génération d'image intégrale, l'analyse du contraste local et l'extraction de carte des contours pour améliorer les régions susceptibles de contenir des caractères de plaques d'immatriculation pour les systèmes en temps réel.

LPR Image processing learning computer vision

CASEDEV.to AI·20/04/2026

Beyond the Crop: Automating "Ghost Mannequin" Effects with Depth-Aware Inpainting

Le contenu décrit comment Rewarx Studio AI automatise l'effet "mannequin fantôme" pour le commerce électronique de vêtements, en surmontant les défis de profondeur et d'occlusion. Leur solution implique un pipeline en trois étapes : masquage sémantique (SAM), estimation de profondeur (Depth Anything) et inpainting contextuel (SDXL).

Image processing computer vision Inpainting e-commerce

DOCDEV.to AI·28/04/2026

Building a No-Install AI Upscaler: Leveraging Cloud GPUs for Seamless Image Processing

GoHard AI Upscaler est un outil d'amélioration d'image de qualité professionnelle basé sur navigateur, supprimant le besoin d'équipements locaux haut de gamme. Il offre une installation nulle et des performances constantes en utilisant Python, des modèles d'IA optimisés et des GPU cloud de Google Colab.

Image processing deep learning cloud computing machine learning

ARTICLEDEV.to AI·21/04/2026

Convert Images into Presentations Automatically Using AI

Le contenu décrit un flux de travail basé sur l'IA pour convertir automatiquement les informations visuelles d'images, telles que des captures d'écran et des diagrammes, en présentations structurées. Ce processus vise à simplifier l'analyse manuelle et la création de diapositives, nécessitant des images claires et de haute qualité pour des résultats optimaux.

Image processing workflow automation Information Extraction AI tools

ARTICLEDEV.to AI·24/04/2026

Dialing in the Perfect Mood: Mastering Photo Lighting with AI Relighting

Le texte décrit comment le rééclairage par IA optimise la photographie de produits pour le commerce électronique, transformant des photos plates en images dynamiques et texturées. Cette capacité d'IA ajuste intelligemment la source de lumière pour modifier l'ambiance, la direction et l'intensité, ce qui permet de gagner du temps et d'assurer la cohérence du flux de travail.

Image processing AI relighting product photography e-commerce

ARTICLEDEV.to AI·21/04/2026

Common Limitations of Image Processing Metrics: A Picture Story

Ce contenu analyse les limitations courantes des métriques de traitement d'image, utilisant des exemples visuels pour illustrer comment les méthodes d'évaluation traditionnelles peuvent ne pas toujours s'aligner avec la perception humaine ou refléter précisément la performance de l'algorithme. Il souligne les défis de l'évaluation objective de la qualité et de l'efficacité du traitement d'image.

evaluation Image processing AI limitations Metrics

DOCDEV.to AI·24/04/2026

Cleaning Up Source Images: A Developer's Guide to Text Removal

Ce guide aborde le problème courant des images sources désordonnées contenant du texte ou des filigranes, qui peuvent nuire aux modèles d'IA ou aux ressources front-end. Il présente la capacité Text Remover de PixelAPI comme une solution intelligente pour supprimer proprement le texte tout en préservant la structure sous-jacente de l'image.

AI applications Image processing API Data preparation

ARTICLEDEV.to AI·24/04/2026

I shipped PhotoSharpener to Show HN and Product Hunt (AI sharpen & upscale in the browser)

PhotoSharpener, une application web alimentée par l'IA pour la netteté et l'agrandissement de photos, a été lancée sur Show HN et Product Hunt. L'auteur sollicite les commentaires de la communauté DEV sur l'UX, la qualité et les fonctionnalités futures.

Image processing Product Launch AI

ARTICLEDEV.to AI·05/05/2026

Transform Your Blurry Photos into HD Masterpieces, Instantly!

Code Scrapper lance ModifyX, un optimiseur d'image IA qui promet de transformer instantanément les photos floues en chefs-d'œuvre HD. Ce produit vise à résoudre le problème des images pixelisées grâce à un traitement rapide et privé.

Image processing ModifyX product Code Scrapper

ARTICLEDEV.to AI·24/04/2026

Cleaning Up Imperfections: Seamless Object Removal with AI Inpainting

Le contenu explique comment l'inpainting par IA permet la suppression transparente d'objets dans les images, éliminant efficacement les distractions. Cette capacité est essentielle pour les développeurs d'applications de médias visuels, réduisant considérablement le temps de post-production dans diverses industries.

visual-media-editing object-removal ai-inpainting Image processing

DOC3Blue1Brown (YouTube)·22/03/2026

How (and why) to take a logarithm of an image

Ce document explique comment et pourquoi appliquer l'opération de logarithme à une image. Il couvre les principes de cette transformation et ses avantages en traitement d'images.

Logarithm Image processing Mathematical operations computer vision

How (and why) to take a logarithm of an image