← heapsort-ai

data synthesis

4 items

RESEARCHarXiv CS.CL·17/04/2026

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

Cette recherche propose TESSY, un cadre de Synthèse de Données par Coopération Enseignant-Élève, pour remédier aux baisses de performance lors du réglage fin de modèles de raisonnement avec des données générées par un modèle plus fort. TESSY permet la génération de séquences synthétiques qui héritent des capacités de raisonnement avancées de l'enseignant tout en maintenant une cohérence stylistique avec la distribution du modèle élève.

27
RESEARCHarXiv CS.AI·il y a 17j

MindLoom: Composing Thought Modes for Frontier-Level Reasoning Data Synthesis

MindLoom est un cadre pour synthétiser des données de raisonnement de niveau avancé, s'attaquant à la diversité limitée et au contrôle instable de la difficulté des méthodes existantes. Il décompose les solutions de problèmes en "chaînes de modes de pensée" et entraîne un modèle de récupération pour guider le processus de raisonnement.

27
RESEARCHarXiv CS.CL·il y a 26j

ToolWeave: Structured Synthesis of Complex Multi-Turn Tool-Calling Dialogues

ToolWeave est un cadre structuré pour la synthèse de dialogues réalistes d'appel d'outils multi-tours, essentiel pour que les LLM fonctionnent comme des agents autonomes. Il résout les problèmes de génération de données synthétiques existants en prenant en charge les flux de travail multi-étapes et en réduisant les hallucinations de paramètres.

27
RESEARCHarXiv CS.LG·il y a 6j

Geometry-Aware Tabular Diffusion

La diffusion tabulaire sensible à la géométrie (GATD) est introduite pour la synthèse tabulaire, améliorant les dénoiseurs avec des angles et des longueurs appariés issus des différences de valeurs de colonne. Elle atteint des performances de pointe avec moins de paramètres, réduisant les erreurs et démontrant que la supervision relationnelle explicite est la clé du gain.

27