← heapsort-ai

model optimization

26 items

RESEARCHarXiv CS.LG·vor 14T

Mixture of Complementary Agents for Robust LLM Ensemble

Diese Forschung befasst sich mit der Herausforderung der Auswahl von Proposer-LLMs für die Multi-KI-Zusammenarbeit, wobei bestehende Methoden oft die Interaktionen zwischen Modellen vernachlässigen. Sie definiert die Proposer-Auswahl als kombinatorisches Problem neu, das auf Komplementarität abzielt, und berücksichtigt die rechnerischen Komplexitäten traditioneller Merkmalsauswahl.

27
RESEARCHarXiv CS.CL·vor 14T

SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning

Diese Forschung stellt SLAP vor, ein neuartiges batch-bewusstes Daten-Auswahl-Framework, das darauf abzielt, die Dateneffizienz beim Instruction Tuning für LLMs zu verbessern. SLAP optimiert das Lernen durch die Bewertung ganzer Batch-Kompositionen, gewährleistet eine umfassende Abdeckung der Datenverteilung und maximiert die Intra-Batch-Diversität, um verlustfreie Leistung bei reduzierten Trainingskosten zu erzielen.

27
NEWSDEV.to AI·4/10/2026

Claude Office Copilot, CoreWeave Cloud, and Models That Slim Themselves

O mundo da IA está mais prático esta semana: o Claude da Anthropic está sendo integrado ao Microsoft Office, e uma nova técnica permite que modelos de IA otimizem suas arquiteturas durante o treinamento, reduzindo custos e latência. Paralelamente, o PyTorch expande suas ferramentas para desenvolvedores e uma nova ferramenta de IA para criação de visuais de redes sociais foi lançada.

26