image generation

60 items

ARTICLEDEV.to AI·il y a 12h

AI Pin Maker — multi-model AI studio for image, video, and custom pin design (just shipped)

AI Pin Maker est un studio d'IA tout-en-un récemment lancé pour la génération d'images, de vidéos, de broches émaillées personnalisées et d'albums. Il se distingue par son routage multi-modèle utilisant plus de 28 modèles sous-jacents, permettant de basculer entre les tâches dans une seule session et un seul compte.

image generation AI studio AI design video generation

NEWSThe Verge AI·21/04/2026

OpenAI’s updated image generator can now pull information from the web

OpenAI a déployé la dernière version de son générateur d'images alimenté par l'IA, ChatGPT Images 2.0, qui peut désormais rechercher sur le web pour créer des images plus sophistiquées à partir d'une seule invite. Alimentée par le nouveau modèle GPT Image 2, cette fonctionnalité avec des "capacités de réflexion" est disponible pour les abonnés ChatGPT Plus et les niveaux supérieurs.

OpenAI Product Update image generation AI

NEWSThe Verge AI·16/04/2026

Gemini can now pull from Google Photos to generate personalized images

Gemini peut désormais utiliser les données de Google Photos pour générer des images personnalisées qui reflètent le style et les goûts de l'utilisateur. Cette fonctionnalité, appelée 'Intelligence Personnelle', exploite les informations des applications Google connectées pour créer des images basées sur le contexte individuel de l'utilisateur.

personalization image generation Gemini Google

ARTICLEDEV.to AI·24/04/2026

GPT Image 2: A Practical Image Model for Developers Who Need Better Text and Layout

GPT Image 2 est un modèle d'image pratique axé sur la production de visuels utilisables pour les développeurs, designers et équipes de contenu, excellant dans la gestion du texte et de la mise en page. Il surpasse les modèles précédents en rendant le texte et en gérant la mise en page de manière fiable, le rendant idéal pour les maquettes et concepts d'interface.

AI models image generation layout developer tools

ARTICLEDEV.to AI·23/04/2026

ERNIE Image Review: Open-Source Text-to-Image for Posters, Comics, and Bilingual Visuals

ERNIE Image de Baidu est un modèle texte-vers-image open-source axé sur la génération de visuels de haute qualité avec du texte lisible intégré et un support bilingue chinois-anglais. Il excelle dans les compositions structurées comme les mises en page d'affiches et les scènes de bande dessinée, s'avérant utile pour divers flux de travail créatifs.

Multilingual AI Text-to-image open-source AI image generation

RESEARCHarXiv CS.LG·il y a 21j

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Cette recherche optimise systématiquement l'inférence des modèles de diffusion en temps réel sur l'Apple M3 Ultra, explorant diverses techniques telles que la conversion CoreML et la quantification. L'étude a atteint 22.7 FPS pour la transformation img2img de 512x512 en combinant la conversion CoreML du SDXS-512 avec un pipeline de caméra à 3 threads.

Diffusion Models Optimization apple-silicon image generation

RESEARCHDEV.to AI·22/04/2026

Playground v2.5: Three Insights towards Enhancing Aesthetic Quality inText-to-Image Generation

Ce contenu présente trois aperçus clés tirés de Playground v2.5, se concentrant sur les méthodes visant à améliorer significativement la qualité esthétique des images produites par les modèles de génération de texte à image. Il aborde probablement des détails techniques qui améliorent l'attrait visuel et la cohérence artistique.

Text-to-image image generation aesthetic quality Generative AI

NEWSDEV.to AI·22/04/2026

gpt-image-2 API: ship 2K AI images in Next.js for $0.21 (2026)

OpenAI a lancé le modèle gpt-image-2 le 21 avril 2026, qui rend jusqu'à 2 000 pixels et prend en charge sept ratios d'aspect avec jusqu'à 8 images cohérentes par appel. Ce nouveau modèle intègre un mode de pensée pour la mise en page et la typographie, améliorant considérablement le rendu du texte et des graphiques.

image generation API AI Model

NEWSDEV.to AI·il y a 11j

ByteDance Open-Sources BAGEL: 7B Multimodal Model for Image Gen, Editing, Understanding

ByteDance a mis en open-source BAGEL, un modèle multimodal de 7B paramètres sous licence Apache 2.0. Il unifie la génération, l'édition, le transfert de style et la compréhension d'images au sein d'une architecture unique, visant un déploiement sur appareil.

Open Source multimodal AI BAGEL image generation

NEWSMicrosoft Research (YouTube)·il y a 6j

Introducing MAI-Image-2.5 | Microsoft AI Models

Ce contenu annonce l'introduction de MAI-Image-2.5, un nouveau modèle d'IA développé par Microsoft. Il met en lumière les dernières avancées des capacités d'IA de Microsoft, spécifiquement pour les tâches liées à l'image.

AI models MAI-Image image generation Microsoft

Introducing MAI-Image-2.5 | Microsoft AI Models

ARTICLEDEV.to AI·il y a 23j

Understanding How ChatGPT Generates Images: A Deep Dive into AI Creativity

Cet article explore comment ChatGPT contribue à la génération d'images, les technologies sous-jacentes et les implications pour les développeurs, artistes et entreprises. La capacité de créer des visuels à partir de descriptions textuelles rationalise les processus et démocratise l'art, améliorant la productivité.

AI Creativity ChatGPT image generation Natural Language Processing

ARTICLEDEV.to AI·il y a 28j

Why text-to-image AI keeps failing at scientific figures (and what actually works)

L'auteur a tenté d'utiliser divers outils d'IA texte-image pour des figures scientifiques, mais a constaté qu'ils échouaient systématiquement à rendre le texte. Cela est dû au fait que les modèles traitent le texte comme des pixels, et seul un outil d'illustration scientifique dédié s'est avéré efficace.

scientific illustration limitations image generation AI

ARTICLEDEV.to AI·il y a 29j

The Compost of Variations

L'article aborde la nature du gaspillage dans l'art génératif, où de multiples variations sont créées et écartées. L'auteur réfléchit à la valeur des images "presque choisies", les considérant comme un aperçu du processus de pensée de l'IA avant qu'elle ne sélectionne un résultat final.

creative process image generation AI art AI Variations

DOCDEV.to AI·il y a 22j

Wiring Magnific Images Into a Vercel Edge Config A/B Test

Ce contenu décrit un test A/B sur raxxo.shop utilisant trois images générées par Magnific et Vercel Edge Config pour évaluer l'impact d'un recadrage plus serré sur le taux de clics (CTR). Une configuration d'une heure a permis à une variante de surpasser le contrôle de 18,4% après 11 jours, l'article fournissant le câblage et le schéma exacts.

Vercel Magnific AI image generation A/B testing

DOCDEV.to AI·25/04/2026

How to Create 360 Panoramas with GPT Image 2 and View Them Interactively

Ce tutoriel explique comment générer des images panoramiques équirectangulaires à 360 degrés avec GPT Image 2 dans ChatGPT. Il couvre également la visualisation interactive de ces images dans un navigateur et leur intégration sur des sites web.

interactive viewer GPT Image 2 tutorial image generation

DOCDEV.to AI·27/04/2026

How to Create AI Product Photos for Your Side Project (Zero Budget)

L'auteur, un développeur avec un budget limité, a utilisé des outils d'IA gratuits pour générer des photos de produits professionnelles pour son application, transformant un obstacle créatif en succès. Il partage cette expérience pour aider d'autres créateurs indépendants à produire des visuels de haute qualité sans dépenser un centime.

marketing image generation AI tools side projects

ARTICLEDEV.to AI·24/04/2026

Routing 30+ image models with one MCP server

Le texte décrit un serveur MCP appelé "prompt-to-asset" qui achemine intelligemment les requêtes vers l'un des plus de 30 modèles d'image en fonction des exigences de la tâche, dépassant les limites des wrappers à modèle unique. Il souligne la complexité de construire cette logique de routage, compte tenu des forces très différentes des divers modèles d'image, telles que le rendu de texte, les fonds transparents et le respect du style.

model selection MCP server AI routing image generation

ARTICLEDEV.to AI·il y a 26j

Midjourney — Deep Dive

Midjourney est reconnue comme le moteur d'IA générative d'images le plus puissant esthétiquement, opérant avec une philosophie qui met l'accent sur la créativité partagée. Initialement un bot Discord, il a évolué en une suite créative complète avec interface web, API et capacités multimodales, visant à démocratiser la création visuelle de haute fidélité.

Creative AI image generation AI tools Midjourney

NEWSDEV.to AI·il y a 9j

Bonsai Image 4B: difusión de 1 bit que corre en un iPhone

PrismML a lancé Bonsai Image 4B, une famille de modèles de génération d'images utilisant des poids 1 bit ou ternaires pour exécuter la diffusion de haute qualité sur des appareils locaux comme les iPhones. Cette innovation permet une compression du modèle de 8,3 fois, le réduisant de 7,75 Go à 0,93 Go, tout en conservant jusqu'à 95 % de la qualité d'origine.

Diffusion Models Edge AI image generation PrismML

ARTICLEDEV.to AI·il y a 25j

Stop Hardcoding Templates: How I Feed a Live 3x2 Inspiration Grid into Gemini Flash

Cet article explique comment automatiser la création d'images Open Graph dynamiques à l'aide d'un pipeline backend qui intègre des tendances visuelles dans Gemini Flash. Cela élimine le besoin de modèles codés en dur et de conception manuelle, garantissant la prévisibilité et évitant les "hallucinations" de l'IA.

image generation Gemini Flash AI automation