RESEARCH28
Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra
arXiv CS.LG·19 de mayo de 2026
Esta investigación optimiza sistemáticamente la inferencia de modelos de difusión en tiempo real en el Apple M3 Ultra, explorando varias técnicas como la conversión CoreML y la cuantificación. El estudio logró 22.7 FPS para la transformación img2img de 512x512 combinando la conversión CoreML del SDXS-512 con una tubería de cámara de 3 hilos.
Leer original ↗