← heapsort-ai

Knowledge Distillation

11 items

ARTICLEDEV.to AI·vor 2T

Cross-Modal Knowledge Distillation for satellite anomaly response operations across multilingual stakeholder groups

Der Autor erkannte, dass die Kreuzmodale Wissensdestillation (CMKD) Kommunikationslücken zwischen technischen Teams, Operationszentren und Versicherungsinteressenten während Satellitenanomalie-Reaktionsoperationen überbrücken könnte. Dieser Ansatz hilft, komplexen technischen Jargon in verständliche Informationen für mehrsprachige Gruppen umzuwandeln, die an kritischen Operationen beteiligt sind.

38
ARTICLEDEV.to AI·vor 4T

Cross-Modal Knowledge Distillation for smart agriculture microgrid orchestration in carbon-negative infrastructure

Der Autor stieß beim Aufbau eines Multi-Agenten-KI-Systems für ein kohlenstoffnegatives intelligentes Agrarmikronetz aufgrund widersprüchlicher Daten aus verschiedenen Modalitäten auf Herausforderungen. Dies führte zu der Erkenntnis, dass die Kreuzmodalitätsausrichtung und nicht die individuelle Agentenintelligenz das Hauptproblem für die effektive Orchestrierung des Systems war.

30
RESEARCHDEV.to AI·4/10/2026

Cross-Modal Knowledge Distillation for planetary geology survey missions with ethical auditability baked in

O texto narra a jornada de pesquisa do autor em destilação de conhecimento cross-modal com auditabilidade ética, impulsionada pela observação de que IAs de classificação mineral podem tomar decisões tecnicamente corretas, mas eticamente ingênuas. O objetivo é desenvolver sistemas de IA que sejam precisos e eticamente robustos para missões de pesquisa geológica planetária.

30
RESEARCHarXiv CS.LG·4/8/2026

Prune-Quantize-Distill: An Ordered Pipeline for Efficient Neural Network Compression

Este artigo propõe um pipeline ordenado (poda, quantização INT8 e destilação de conhecimento) para otimizar a compressão de redes neurais, visando a latência de inferência medida em vez de métricas indiretas. A pesquisa revela que a quantização INT8 oferece o principal benefício de tempo de execução, enquanto a poda atua como um pré-condicionador e a destilação de conhecimento recupera a precisão.

28
RESEARCHarXiv CS.CL·vor 27T

ReAD: Reinforcement-Guided Capability Distillation for Large Language Models

ReAD schlägt einen verstärkungsgesteuerten Ansatz zur Fähigkeitsdestillation für Große Sprachmodelle (LLMs) vor, um Modelle zu komprimieren und dabei wesentliche Fähigkeiten für nachgelagerte Aufgaben zu erhalten. Dieser Rahmen berücksichtigt explizit die Interdependenz von Fähigkeiten, um das Token-Budget zu optimieren und die Degradierung nützlicher Fähigkeiten zu verhindern.

28
RESEARCHarXiv CS.CL·4/13/2026

WAND: Windowed Attention and Knowledge Distillation for Efficient Autoregressive Text-to-Speech Models

WAND führt ein Framework ein, das vortrainierte autoregressive Text-zu-Sprache (AR-TTS)-Modelle an eine konstante Rechen- und Speicherkomplexität anpasst. Dies gelingt durch die Trennung der Attention in globale und lokale Sliding-Window-Mechanismen, den Einsatz von Curriculum Learning und die Nutzung von Wissensdestillation, um eine hochwertige Sprachsynthese bei erheblicher Reduzierung des KV-Cache-Speichers zu gewährleisten.

27
RESEARCHarXiv CS.LG·5/7/2026

Continual Distillation of Teachers from Different Domains

Diese Forschung stellt Continual Distillation (CD) vor, ein neues Paradigma, bei dem ein Schülermodell sequenziell von einem Strom von Lehrmodellen lernt, ohne frühere Lehrer beizubehalten. Es adressiert Herausforderungen wie den Transfer (UKT) und das Vergessen (UKF) von ungesehenem Wissen mittels Self External Data Distillation (SE2D), das unbeschriftete externe Daten verwendet, um das Lernen über heterogene Lehrer hinweg zu stabilisieren.

27
RESEARCHarXiv CS.CL·vor 15T

Knowledge Distillation for Low-Resource Open-source Text-to-SQL Model

Dieser Artikel schlägt ein wissensbasiertes Text-to-SQL-Framework vor, um natürliche Sprachfragen in ausführbare SQL-Abfragen umzuwandeln, selbst in ressourcenarmen Umgebungen. Es begegnet Herausforderungen wie knappen annotierten Daten und undurchsichtigen Schemadefinitionen durch die Integration von aufgabenspezifischem Wissen in Training und Inferenz.

27
RESEARCHarXiv CS.CL·4/6/2026

Reinforcement Learning-based Knowledge Distillation with LLM-as-a-Judge

Este artigo propõe uma estrutura de Reinforcement Learning (RL) que utiliza um LLM como juiz para gerar recompensas, permitindo a destilação de conhecimento sem a necessidade de rótulos de verdade fundamental. A abordagem demonstra ganhos substanciais de desempenho em benchmarks de raciocínio matemático, sugerindo que avaliadores baseados em LLM podem produzir sinais de treinamento eficazes.

27
ARTICLEDEV.to AI·4/26/2026

Cross-Modal Knowledge Distillation for deep-sea exploration habitat design under multi-jurisdictional compliance

Dieser Artikel schlägt vor, Cross-Modale Wissensdestillation (CMKD) für das Design von Tiefsee-Explorationshabitaten anzuwenden. Die Technik soll chaotische, multi-quellenbasierte Datenströme integrieren, um komplexe Umwelt-, Struktur- und Rechtskonformitätsanforderungen über mehrere Gerichtsbarkeiten hinweg zu erfüllen.

26