← heapsort-ai

distributed training

4 items

ARTICLE↑ trendingReddit r/MachineLearning·12/04/2026

Educational PyTorch repo for distributed training from scratch: DP, FSDP, TP, FSDP+TP, and PP [P]

Este repositório educacional em PyTorch implementa diversas técnicas de paralelismo para treinamento distribuído, como DP, FSDP, TP e PP, do zero. Ele expõe a lógica de forward/backward e os coletivos explicitamente, permitindo a compreensão direta dos algoritmos e padrões de comunicação sem abstrações de alto nível.

43
ARTICLEDEV.to AI·12/04/2026

QIS vs DiLoCo: Why Google's Distributed Training Breakthrough and Quadratic Intelligence Swarm Solve Completely Different Problems

O artigo diferencia as soluções de treinamento distribuído da Google (DiLoCo/DiPaCo) do protocolo Quadratic Intelligence Swarm (QIS), destacando que abordam problemas fundamentalmente distintos. Enquanto as ferramentas da Google otimizam o treinamento de modelos únicos em larga escala, o QIS foca no roteamento de resultados de aprendizado entre múltiplas instituições sem centralizar dados.

27