← heapsort-ai

image generation

60 items

NEWSThe Verge AI·21/4/2026

OpenAI’s updated image generator can now pull information from the web

OpenAI ha lanzado la última versión de su generador de imágenes con IA, ChatGPT Images 2.0, que ahora puede buscar en la web para crear imágenes más sofisticadas a partir de una única instrucción. Impulsado por el nuevo modelo GPT Image 2, esta característica con "capacidades de pensamiento" está disponible para suscriptores de ChatGPT Plus y planes superiores.

33
RESEARCHarXiv CS.LG·hace 21d

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

Esta investigación optimiza sistemáticamente la inferencia de modelos de difusión en tiempo real en el Apple M3 Ultra, explorando varias técnicas como la conversión CoreML y la cuantificación. El estudio logró 22.7 FPS para la transformación img2img de 512x512 combinando la conversión CoreML del SDXS-512 con una tubería de cámara de 3 hilos.

28
RESEARCHDEV.to AI·22/4/2026

Playground v2.5: Three Insights towards Enhancing Aesthetic Quality inText-to-Image Generation

Este contenido presenta tres ideas clave derivadas de Playground v2.5, centrándose en métodos para mejorar significativamente la calidad estética de las imágenes producidas por modelos de generación de texto a imagen. Probablemente profundiza en detalles técnicos que mejoran el atractivo visual y la coherencia artística.

28
ARTICLEDEV.to AI·hace 29d

The Compost of Variations

El artículo aborda la naturaleza del desperdicio en el arte generativo, donde se crean y descartan múltiples variaciones. El autor reflexiona sobre el valor de las imágenes "casi elegidas", viéndolas como una visión del proceso de pensamiento de la IA antes de seleccionar un resultado final.

27
ARTICLEDEV.to AI·24/4/2026

Routing 30+ image models with one MCP server

El texto describe un servidor MCP llamado "prompt-to-asset" que enruta inteligentemente las solicitudes a uno de más de 30 modelos de imagen según los requisitos de la tarea, superando las limitaciones de los wrappers de modelo único. Destaca la complejidad de construir esta lógica de enrutamiento, dadas las diferentes fortalezas de varios modelos de imagen, como la renderización de texto, los fondos transparentes y la adherencia al estilo.

27
ARTICLEDEV.to AI·hace 26d

Midjourney — Deep Dive

Midjourney es reconocida como el motor de IA generativa de imágenes más potente estéticamente, operando con una filosofía que enfatiza la creatividad compartida. Aunque comenzó como un bot de Discord, ha evolucionado a una suite creativa completa con interfaz web, APIs y capacidades multimodales, enfocándose en democratizar la creación visual de alta fidelidad.

27