heapsort
RESEARCH28

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

arXiv CS.LG·19 de maio de 2026

Esta pesquisa otimiza sistematicamente a inferência de modelos de difusão em tempo real no Apple M3 Ultra, explorando várias técnicas como conversão CoreML e quantização. O estudo alcançou 22.7 FPS para transformação img2img de 512x512 combinando a conversão CoreML do SDXS-512 com um pipeline de câmera de 3 threads.

Ler original