← heapsort-ai

model optimization

26 items

RESEARCHarXiv CS.LG·14d atrás

Mixture of Complementary Agents for Robust LLM Ensemble

Esta pesquisa aborda o desafio da seleção de LLMs proponentes para colaboração multi-IA, onde os métodos existentes frequentemente ignoram as interações entre os modelos. Redefine a seleção de proponentes como um problema combinatório focado na complementaridade, reconhecendo as complexidades computacionais da seleção de características tradicional.

27
RESEARCHarXiv CS.CL·14d atrás

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Esta pesquisa apresenta SLAP, um novo framework de seleção de dados sensível a lotes, projetado para melhorar a eficiência de dados no ajuste de instruções para LLMs. O SLAP otimiza o aprendizado avaliando composições de lotes inteiros, garantindo uma cobertura abrangente da distribuição de dados e maximizando a diversidade intra-lote para alcançar desempenho sem perdas com custos de treinamento reduzidos.

27
NEWSDEV.to AI·10/04/2026

Claude Office Copilot, CoreWeave Cloud, and Models That Slim Themselves

O mundo da IA está mais prático esta semana: o Claude da Anthropic está sendo integrado ao Microsoft Office, e uma nova técnica permite que modelos de IA otimizem suas arquiteturas durante o treinamento, reduzindo custos e latência. Paralelamente, o PyTorch expande suas ferramentas para desenvolvedores e uma nova ferramenta de IA para criação de visuais de redes sociais foi lançada.

26