RESEARCH28
Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra
arXiv CS.LG·19 mai 2026
Cette recherche optimise systématiquement l'inférence des modèles de diffusion en temps réel sur l'Apple M3 Ultra, explorant diverses techniques telles que la conversion CoreML et la quantification. L'étude a atteint 22.7 FPS pour la transformation img2img de 512x512 en combinant la conversion CoreML du SDXS-512 avec un pipeline de caméra à 3 threads.
Lire l'original ↗