heapsort
RESEARCH28

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

arXiv CS.LG·19 mai 2026

Cette recherche optimise systématiquement l'inférence des modèles de diffusion en temps réel sur l'Apple M3 Ultra, explorant diverses techniques telles que la conversion CoreML et la quantification. L'étude a atteint 22.7 FPS pour la transformation img2img de 512x512 en combinant la conversion CoreML du SDXS-512 avec un pipeline de caméra à 3 threads.

Lire l'original