heapsort
RESEARCH28

Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra

arXiv CS.LG·19. Mai 2026

Diese Forschung optimiert systematisch die Inferenz von Echtzeit-Diffusionsmodellen auf dem Apple M3 Ultra und untersucht verschiedene Techniken wie CoreML-Konvertierung und Quantisierung. Die Studie erreichte 22.7 FPS für die 512x512 img2img-Transformation durch die Kombination der CoreML-Konvertierung des SDXS-512 mit einer 3-Thread-Kamerapipeline.

Original lesen