← heapsort-ai

model optimization

26 items

RESEARCHarXiv CS.LG·il y a 14j

Mixture of Complementary Agents for Robust LLM Ensemble

Cette recherche aborde le défi de la sélection de LLM proposants pour la collaboration multi-IA, où les méthodes existantes négligent souvent les interactions entre les modèles. Elle redéfinit la sélection de proposants comme un problème combinatoire axé sur la complémentarité, reconnaissant les complexités de calcul de la sélection de caractéristiques traditionnelle.

27
RESEARCHarXiv CS.CL·il y a 14j

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Cette recherche présente SLAP, un nouveau cadre de sélection de données sensible aux lots conçu pour améliorer l'efficacité des données lors du réglage des instructions pour les LLM. SLAP optimise l'apprentissage en évaluant des compositions de lots entiers, assurant une couverture complète de la distribution des données et maximisant la diversité intra-lot pour atteindre des performances sans perte avec des coûts d'entraînement réduits.

27
NEWSDEV.to AI·10/04/2026

Claude Office Copilot, CoreWeave Cloud, and Models That Slim Themselves

O mundo da IA está mais prático esta semana: o Claude da Anthropic está sendo integrado ao Microsoft Office, e uma nova técnica permite que modelos de IA otimizem suas arquiteturas durante o treinamento, reduzindo custos e latência. Paralelamente, o PyTorch expande suas ferramentas para desenvolvedores e uma nova ferramenta de IA para criação de visuais de redes sociais foi lançada.

26