← heapsort-ai

data synthesis

4 items

RESEARCHarXiv CS.CL·17/4/2026

How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data

Esta investigación propone TESSY, un marco de Síntesis de Datos por Cooperación Profesor-Estudiante, para abordar las caídas de rendimiento al ajustar modelos de razonamiento con datos generados por un modelo más fuerte. TESSY permite la generación de secuencias sintéticas que heredan capacidades avanzadas de razonamiento del profesor, manteniendo la consistencia estilística con la distribución del modelo estudiante.

27
RESEARCHarXiv CS.LG·hace 6d

Geometry-Aware Tabular Diffusion

Se introduce Geometry-Aware Tabular Diffusion (GATD) para la síntesis tabular, mejorando los denoisers con ángulos y longitudes pareadas de las diferencias de valores de columna. Logra un rendimiento de vanguardia con menos parámetros, reduciendo errores y demostrando que la supervisión relacional explícita impulsa las ganancias.

27