A Hackable ML Compiler Stack in 5,000 Lines of Python [P]
L'auteur a développé une pile de compilateur ML simplifiée et modifiable en 5 000 lignes de Python qui émet du CUDA, visant à offrir une référence facile à suivre sans la complexité des frameworks existants. Elle compile de petits modèles comme TinyLlama et Qwen2.5-7B à travers six représentations intermédiaires, privilégiant la clarté à la performance.