← heapsort-ai

image generation

60 items

RESEARCHDEV.to AI·vor 23T

The cheapest and fastest way to generate an image

Der Inhalt vergleicht 25 Bildgenerierungsmodelle von 6 Anbietern auf dem Vercel AI Gateway und identifiziert die günstigsten und schnellsten Optionen. Es werden erhebliche Preis- und Geschwindigkeitsunterschiede aufgezeigt, wobei Modelle wie bfl/flux-2-klein-4b und bfl/flux-pro-1.1 bei Kosten bzw. Geschwindigkeit führend sind.

27
ARTICLEDEV.to AI·vor 17T

Why is Google's best image model called "Nano Banana"? And why are you using the wrong one?

Dieser Artikel befasst sich mit der verwirrenden Benennung und Nutzung der Bildmodelle von Google AI Studio, wobei sechs verschiedene Modelle aus zwei Hauptfamilien hervorgehoben werden. Er bietet einen praktischen Leitfaden, welches Modell für verschiedene Zwecke zu verwenden ist, und berücksichtigt das Preis-Leistungs-Verhältnis, einschließlich des Modells „Nano Banana“.

27
ARTICLEDEV.to AI·vor 19T

Building an AI face-doppelganger prank with Flux Kontext Pro and aggressive image degradation

Dieser Artikel beschreibt den technischen Aufbau eines KI-"Gesichts-Doppelgänger"-Streiches unter Verwendung von Flux Kontext Pro und Replicate-Modellen zur Erzeugung plausibler Doppelgänger. Er behandelt die Herausforderungen bei der Erstellung von Prompts, der Anwendung aggressiver Bildverschlechterung und der Vermeidung von Fallstricken bei Vercel-Serverless, damit die KI-Ausgabe wie echte Fotos von Fremden aussieht.

27
RESEARCHarXiv CS.LG·4/24/2026

Frequency-Forcing: From Scaling-as-Time to Soft Frequency Guidance

Diese Forschung konzentriert sich auf die Verbesserung der Bildgenerierung in Flow-Matching-Modellen durch die Integration einer expliziten Generierungsreihenfolge, von groben zu feinen Details. Sie vergleicht K-Flow und Latent Forcing und schlägt einen neuen kompatiblen Weg für die skalenorientierte Generierung über einen Hilfsstrom vor.

27
RESEARCHarXiv CS.LG·5/7/2026

Lookahead Drifting Model

Dieses Papier schlägt ein "Lookahead-Drifting-Modell" für die Verteilungszuordnung vor, das die Leistung der Bildgenerierung durch eine einstufige neuronale Funktionsbewertung verbessert. Das Modell berechnet in jeder Trainingsiteration sequenziell eine Reihe von Drifting-Termen, die positive Stichproben und die Modellausgabe nutzen, um Gradienteninformationen höherer Ordnung zu erfassen.

27
RESEARCHarXiv CS.CL·vor 12T

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

Der Artikel stellt ICG vor, ein neuartiges Framework zur personalisierten Titelbilderzeugung, das MLLM-basiertes Prompting mit Präferenzanpassung kombiniert. Es nutzt semantische Merkmale und Benutzer-Embeddings zur Kontextualisierung des Diffusionsmodells und wendet eine Multi-Reward-Lernstrategie an, um den Mangel an beschrifteter Überwachung zu beheben.

27
ARTICLEDEV.to AI·4/27/2026

I regenerated 4 character portraits with GPT Image 2.0: signup +5%, chat engagement +8%

Der Autor hat vier Charakterporträts in seiner App Tendera mit GPT Image 2.0 neu generiert und dabei eine Steigerung der Besucher-zu-Anmelde-Rate um 5 % und der Besucher-zu-Chat-Rate um 8 % festgestellt. Dies deutet darauf hin, dass verbesserte KI-generierte Kunst die Nutzerbindung über die anfängliche Akquise hinaus erheblich steigerte.

27
DOCDEV.to AI·4/25/2026

IP-Adapter + LoRA for product catalog rendering — putting shop items on AI characters

Dieser Inhalt stellt einen ausführbaren ComfyUI-Workflow zum Rendern von KI-Charakteren mit Ladenartikeln vor, der LoRA für Charakterstabilität und IP-Adapter für Referenzbildmerkmale kombiniert. Er erklärt, wie diese Techniken auszubalancieren sind, und empfiehlt ein moderates IP-Adapter-Gewicht und eine frühe Übergabe, um eine Gesichtsverformung zu vermeiden.

27