RESEARCH28
Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra
arXiv CS.LG·19. Mai 2026
Diese Forschung optimiert systematisch die Inferenz von Echtzeit-Diffusionsmodellen auf dem Apple M3 Ultra und untersucht verschiedene Techniken wie CoreML-Konvertierung und Quantisierung. Die Studie erreichte 22.7 FPS für die 512x512 img2img-Transformation durch die Kombination der CoreML-Konvertierung des SDXS-512 mit einer 3-Thread-Kamerapipeline.
Original lesen ↗