model optimization

26 items

RESEARCHarXiv CS.LG·il y a 14j

Mixture of Complementary Agents for Robust LLM Ensemble

Cette recherche aborde le défi de la sélection de LLM proposants pour la collaboration multi-IA, où les méthodes existantes négligent souvent les interactions entre les modèles. Elle redéfinit la sélection de proposants comme un problème combinatoire axé sur la complémentarité, reconnaissant les complexités de calcul de la sélection de caractéristiques traditionnelle.

AI models combinatorial selection proposer selection model optimization

RESEARCHarXiv CS.CL·il y a 14j

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Cette recherche présente SLAP, un nouveau cadre de sélection de données sensible aux lots conçu pour améliorer l'efficacité des données lors du réglage des instructions pour les LLM. SLAP optimise l'apprentissage en évaluant des compositions de lots entiers, assurant une couverture complète de la distribution des données et maximisant la diversité intra-lot pour atteindre des performances sans perte avec des coûts d'entraînement réduits.

Instruction Tuning LLMs machine learning model optimization

NEWSDEV.to AI·10/04/2026

Claude Office Copilot, CoreWeave Cloud, and Models That Slim Themselves

O mundo da IA está mais prático esta semana: o Claude da Anthropic está sendo integrado ao Microsoft Office, e uma nova técnica permite que modelos de IA otimizem suas arquiteturas durante o treinamento, reduzindo custos e latência. Paralelamente, o PyTorch expande suas ferramentas para desenvolvedores e uma nova ferramenta de IA para criação de visuais de redes sociais foi lançada.

cloud computing machine learning AI Assistants AI

ARTICLEDEV.to AI·02/05/2026

Scaling AI: When Bigger Isn't Better

Cet article examine le concept de mise à l'échelle de l'IA, remettant en question l'idée que des modèles plus grands sont toujours meilleurs en raison de problèmes de performance et de coûts accrus. Il présente diverses méthodes pour augmenter la capacité des modèles d'IA, soulignant l'importance de l'optimisation.

AI scaling model optimization performance Cost Efficiency

ARTICLEKDNuggets·il y a 25j

TurboQuant: Is the Compression and Performance Worth the Hype?

Ce contenu examine les affirmations de TurboQuant concernant la compression et la performance, en se demandant si elle augmente réellement l'efficacité sans perte de précision. Il explore si la technologie est à la hauteur de son battage médiatique.

efficiency AI compression model optimization performance

TurboQuant: Is the Compression and Performance Worth the Hype?

ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Speculative decoding question, 665% speed increase

Une question concernant le décodage spéculatif met en évidence une augmentation de vitesse remarquable de 665%. Ce sujet indique une discussion technique sur l'optimisation des modèles d'IA.

deep learning AI performance model optimization speed improvement