← heapsort-ai

model optimization

26 items

RESEARCHarXiv CS.LG·hace 15d

Mixture of Complementary Agents for Robust LLM Ensemble

Esta investigación aborda el desafío de seleccionar LLMs propulsores para la colaboración multi-IA, donde los métodos existentes a menudo descuidan las interacciones entre modelos. Redefine la selección de propulsores como un problema combinatorio centrado en la complementariedad, reconociendo las complejidades computacionales de la selección de características tradicional.

27
RESEARCHarXiv CS.CL·hace 15d

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Esta investigación introduce SLAP, un novedoso marco de selección de datos consciente de lotes diseñado para mejorar la eficiencia de datos en el ajuste de instrucciones para LLMs. SLAP optimiza el aprendizaje evaluando composiciones de lotes completas, asegurando una cobertura integral de la distribución de datos y maximizando la diversidad dentro del lote para lograr un rendimiento sin pérdidas con costos de entrenamiento reducidos.

27
NEWSDEV.to AI·10/4/2026

Claude Office Copilot, CoreWeave Cloud, and Models That Slim Themselves

O mundo da IA está mais prático esta semana: o Claude da Anthropic está sendo integrado ao Microsoft Office, e uma nova técnica permite que modelos de IA otimizem suas arquiteturas durante o treinamento, reduzindo custos e latência. Paralelamente, o PyTorch expande suas ferramentas para desenvolvedores e uma nova ferramenta de IA para criação de visuais de redes sociais foi lançada.

26