image generation

60 items

RESEARCHDEV.to AI·il y a 23j

The cheapest and fastest way to generate an image

Le contenu compare 25 modèles de génération d'images de 6 fournisseurs sur Vercel AI Gateway, identifiant les options les moins chères et les plus rapides. Il révèle des différences significatives de prix et de vitesse, avec des modèles comme bfl/flux-2-klein-4b et bfl/flux-pro-1.1 en tête pour le coût et la vitesse, respectivement.

Benchmarking image generation AI cost

ARTICLEDEV.to AI·09/05/2026

Beyond the Prompt: Engineering "Surgical Precision" into the AI Visual Pipeline

L'IA générative actuelle produit facilement des images, mais échoue sur des détails cruciaux pour l'e-commerce et le branding à cause des "hallucinations". La "précision chirurgicale" dans les pipelines visuels d'IA, telle que Pixizen, vise à prévenir la perte de détails et à automatiser la transition vers des actifs de mouvement de haute qualité.

Branding image generation Visual AI e-commerce

RESEARCHDEV.to AI·il y a 20j

DualFashion: Dual-Diffusion Transformer Generates Outfit Images & Text

DualFashion est une architecture Transformer à double diffusion qui génère conjointement des images d'articles de mode et des descriptions textuelles. Il surpasse les méthodes de pointe sur les benchmarks iFashion et Polyvore-U pour la recommandation générative de tenues, fournissant des résultats interprétables.

Diffusion Models image generation text generation fashion AI

NEWSThe Verge AI·il y a 21j

Google Pics is a new app that tries to fix AI image editing

Google a lancé une nouvelle application de génération d'images IA appelée Pics pour Workspace, simplifiant l'édition. Elle permet aux utilisateurs de cliquer sur des parties spécifiques d'une image pour apporter des modifications, au lieu de réécrire des prompts entiers.

Google Pics AI editing Google Workspace image generation

DOCDEV.to AI·02/05/2026

Flux 2 Max Image API: Developer Guide for Production Workflows (2026)

Ce guide du développeur présente Flux 2 Max, le modèle phare de génération d'images de haute qualité de Black Forest Labs. Il détaille l'intégration API, les différences entre les niveaux et l'optimisation des coûts pour les flux de travail de production professionnels.

AI models image generation developer guide API Integration

ARTICLEDEV.to AI·il y a 17j

Why is Google's best image model called "Nano Banana"? And why are you using the wrong one?

Cet article explore la nomenclature et l'utilisation confuses des modèles d'image de Google AI Studio, mettant en évidence six modèles différents répartis en deux familles principales. Il offre un guide pratique sur le modèle à utiliser pour différents objectifs et évalue le rapport qualité-prix, y compris le modèle "Nano Banana".

AI models Google AI Imagen image generation

NEWSDEV.to AI·03/05/2026

Together AI Free API: Run Llama 3.3, DeepSeek R1, and FLUX Image Generation for Free in 2026

Together AI propose un accès API gratuit à des modèles avancés tels que Llama 3.3, DeepSeek R1 et FLUX pour la génération d'images. Cet accès gratuit sera disponible jusqu'en 2026, permettant aux développeurs d'utiliser ces puissantes capacités d'IA sans frais.

image generation API Free Access Together AI

ARTICLEDEV.to AI·il y a 19j

Building an AI face-doppelganger prank with Flux Kontext Pro and aggressive image degradation

Cet article détaille la construction technique d'une farce de "double facial" avec IA, utilisant Flux Kontext Pro et des modèles Replicate pour générer des sosies plausibles. Il aborde les défis de la création de prompts, l'application d'une dégradation agressive de l'image et les pièges du serverless Vercel pour que la sortie de l'IA ressemble à de vraies photos d'inconnus.

web development prank technical implementation image generation

RESEARCHarXiv CS.LG·24/04/2026

Frequency-Forcing: From Scaling-as-Time to Soft Frequency Guidance

Cette recherche vise à améliorer la génération d'images dans les modèles de flow-matching en intégrant un ordre de génération explicite, du détail grossier au fin. Elle compare K-Flow et Latent Forcing, proposant une nouvelle voie compatible pour la génération ordonnée par échelle via un flux auxiliaire.

neural networks image generation machine-learning-models Generative AI

RESEARCHarXiv CS.LG·07/05/2026

Lookahead Drifting Model

Cet article propose un modèle de dérive "lookahead" pour le mappage de distributions, améliorant les performances de génération d'images avec une évaluation fonctionnelle neuronale en une seule étape. Le modèle calcule séquentiellement un ensemble de termes de dérive à chaque itération d'entraînement, en utilisant des échantillons positifs et les sorties du modèle pour capturer des informations de gradient d'ordre supérieur.

neural networks Optimization deep learning machine learning

RESEARCHarXiv CS.CL·il y a 12j

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

L'article propose ICG, un nouveau cadre pour la génération personnalisée d'images de couverture intégrant la sollicitation basée sur les MLLM avec l'alignement des préférences. Il utilise des caractéristiques sémantiques et des embeddings d'utilisateur pour contextualiser le modèle de diffusion et adopte une stratégie d'apprentissage multi-récompense pour pallier le manque de supervision étiquetée.

personalization Diffusion Models MLLMs image generation

DOCDEV.to AI·il y a 21j

From Idea to Image: A Practical Midjourney Prompting Guide

Ce guide pratique explique comment créer des invites Midjourney efficaces, transformant des idées en images détaillées. Il propose un flux de travail réutilisable pour diverses applications, axé sur la clarté pour les débutants et le contrôle pour les utilisateurs avancés.

prompt-engineering learning image generation AI art

ARTICLEDEV.to AI·27/04/2026

I regenerated 4 character portraits with GPT Image 2.0: signup +5%, chat engagement +8%

L'auteur a régénéré quatre portraits de personnages pour son application Tendera avec GPT Image 2.0, constatant une augmentation de 5 % du taux de conversion visiteur-inscription et de 8 % du taux de visiteur-chat. Cela indique que l'art amélioré généré par l'IA a considérablement stimulé l'engagement des utilisateurs au-delà de l'acquisition initiale.

product development user experience Metrics image generation

DOCDEV.to AI·25/04/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Ce contenu présente un flux de travail ComfyUI exécutable pour rendre des personnages IA portant des articles de magasin, combinant LoRA pour la stabilité du personnage et IP-Adapter pour les caractéristiques de l'image de référence. Il détaille comment équilibrer ces techniques, recommandant un poids modéré pour IP-Adapter et un transfert précoce pour éviter la dérive du visage du personnage.

IP-Adapter image generation LoRA Generative AI

ARTICLEDEV.to AI·21/04/2026

How to Create Personalized Images with the New Gemini App Features

Google a mis à jour son application Gemini avec de nouvelles fonctionnalités qui améliorent la création d'images personnalisées, soulignant l'importance de l'IA pour des expériences utilisateur sur mesure. Les utilisateurs peuvent désormais générer des visuels reflétant leurs goûts individuels ou l'identité de leur marque, augmentant ainsi l'engagement.

personalization AI applications Google Gemini machine learning

ARTICLEDEV.to AI·09/04/2026

Meta's New Model Has 16 Tools. Here's What They Do.

O novo modelo Muse Spark da Meta, competitivo com GPT-5.4 e Gemini 3.1 Pro, destaca-se por seu catálogo de 16 ferramentas integradas. Ele oferece um sandbox Python 3.9 com OpenCV e permite gerar e analisar imagens instantaneamente no mesmo ambiente, incorporando recursos como o Segment Anything.

Muse Spark Meta AI image generation AI tools

NEWSOpenAI Blog·21/04/2026

Introducing ChatGPT Images 2.0

ChatGPT Images 2.0 introduit un modèle de génération d'images de pointe avec un rendu de texte amélioré, un support multilingue et un raisonnement visuel avancé.

AI models multimodal AI image generation Generative AI

DOCOpenAI Blog·10/04/2026

Creating images with ChatGPT

Ce contenu explique comment créer et affiner des images avec ChatGPT. Il couvre l'utilisation de prompts clairs, l'itération de designs et la génération de visuels de haute qualité en quelques minutes.

ChatGPT image generation prompts AI art

NEWSDEV.to AI·19/04/2026

OpenClaw v2026.3.28: xAI Grok Gets Web Search, MiniMax Brings Image Generation

OpenClaw v2026.3.28 prend désormais en charge la recherche web native via l'infrastructure de Grok (xAI) et intègre MiniMax comme nouveau fournisseur de génération d'images, aux côtés de DALL-E. La mise à jour étend également la reconnaissance des identifiants pour divers modèles d'IA et affine la validation des configurations.

web search AI models AI platform image generation

ARTICLEDEV.to AI·12/04/2026

Stop Choosing Between Speed and LoRAs: Meet ComfyUI-TensorRT-Reforge 🚀

Cet article présente ComfyUI-TensorRT-Reforge, un nouveau nœud personnalisé pour ComfyUI qui accélère l'inférence des modèles d'IA avec TensorRT, permettant l'utilisation de LoRAs. Il résout le problème de la génération lente d'images et les limites des solutions existantes, combinant vitesse et flexibilité.

AI acceleration image generation TensorRT LoRAs