← heapsort-ai

image generation

60 items

RESEARCHDEV.to AI·il y a 23j

The cheapest and fastest way to generate an image

Le contenu compare 25 modèles de génération d'images de 6 fournisseurs sur Vercel AI Gateway, identifiant les options les moins chères et les plus rapides. Il révèle des différences significatives de prix et de vitesse, avec des modèles comme bfl/flux-2-klein-4b et bfl/flux-pro-1.1 en tête pour le coût et la vitesse, respectivement.

27
ARTICLEDEV.to AI·09/05/2026

Beyond the Prompt: Engineering "Surgical Precision" into the AI Visual Pipeline

L'IA générative actuelle produit facilement des images, mais échoue sur des détails cruciaux pour l'e-commerce et le branding à cause des "hallucinations". La "précision chirurgicale" dans les pipelines visuels d'IA, telle que Pixizen, vise à prévenir la perte de détails et à automatiser la transition vers des actifs de mouvement de haute qualité.

27
ARTICLEDEV.to AI·il y a 17j

Why is Google's best image model called "Nano Banana"? And why are you using the wrong one?

Cet article explore la nomenclature et l'utilisation confuses des modèles d'image de Google AI Studio, mettant en évidence six modèles différents répartis en deux familles principales. Il offre un guide pratique sur le modèle à utiliser pour différents objectifs et évalue le rapport qualité-prix, y compris le modèle "Nano Banana".

27
ARTICLEDEV.to AI·il y a 19j

Building an AI face-doppelganger prank with Flux Kontext Pro and aggressive image degradation

Cet article détaille la construction technique d'une farce de "double facial" avec IA, utilisant Flux Kontext Pro et des modèles Replicate pour générer des sosies plausibles. Il aborde les défis de la création de prompts, l'application d'une dégradation agressive de l'image et les pièges du serverless Vercel pour que la sortie de l'IA ressemble à de vraies photos d'inconnus.

27
RESEARCHarXiv CS.LG·07/05/2026

Lookahead Drifting Model

Cet article propose un modèle de dérive "lookahead" pour le mappage de distributions, améliorant les performances de génération d'images avec une évaluation fonctionnelle neuronale en une seule étape. Le modèle calcule séquentiellement un ensemble de termes de dérive à chaque itération d'entraînement, en utilisant des échantillons positifs et les sorties du modèle pour capturer des informations de gradient d'ordre supérieur.

27
RESEARCHarXiv CS.CL·il y a 12j

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

L'article propose ICG, un nouveau cadre pour la génération personnalisée d'images de couverture intégrant la sollicitation basée sur les MLLM avec l'alignement des préférences. Il utilise des caractéristiques sémantiques et des embeddings d'utilisateur pour contextualiser le modèle de diffusion et adopte une stratégie d'apprentissage multi-récompense pour pallier le manque de supervision étiquetée.

27
ARTICLEDEV.to AI·27/04/2026

I regenerated 4 character portraits with GPT Image 2.0: signup +5%, chat engagement +8%

L'auteur a régénéré quatre portraits de personnages pour son application Tendera avec GPT Image 2.0, constatant une augmentation de 5 % du taux de conversion visiteur-inscription et de 8 % du taux de visiteur-chat. Cela indique que l'art amélioré généré par l'IA a considérablement stimulé l'engagement des utilisateurs au-delà de l'acquisition initiale.

27
DOCDEV.to AI·25/04/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Ce contenu présente un flux de travail ComfyUI exécutable pour rendre des personnages IA portant des articles de magasin, combinant LoRA pour la stabilité du personnage et IP-Adapter pour les caractéristiques de l'image de référence. Il détaille comment équilibrer ces techniques, recommandant un poids modéré pour IP-Adapter et un transfert précoce pour éviter la dérive du visage du personnage.

27
ARTICLEDEV.to AI·21/04/2026

How to Create Personalized Images with the New Gemini App Features

Google a mis à jour son application Gemini avec de nouvelles fonctionnalités qui améliorent la création d'images personnalisées, soulignant l'importance de l'IA pour des expériences utilisateur sur mesure. Les utilisateurs peuvent désormais générer des visuels reflétant leurs goûts individuels ou l'identité de leur marque, augmentant ainsi l'engagement.

27