← heapsort-ai

AI Research

146 items

ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

Does submitting to only journals negatively affect research career after finishing PhD? [D]

El contenido pregunta si publicar únicamente en revistas de ML (como TMLR, JMLR) en lugar de conferencias afecta negativamente las oportunidades de empleo para puestos de científico de investigación de ML en empresas, considerando la percibida imparcialidad de los procesos de revisión de las revistas. La discusión se centra en carreras corporativas post-doctorado.

36
ARTICLE↑ trendingReddit r/MachineLearning·13/4/2026

[ICML 2026] Extending the deadline for reviewer final justifications while not extending for Author-AC comments was a huge mistake [D]

El autor critica la decisión de extender el plazo para las justificaciones finales de los revisores en ICML 2026 sin extender el plazo para que los autores contacten a los ACs, considerándola un gran error. Un revisor planteó nuevas cuestiones críticas en su justificación final, no mencionadas anteriormente, lo que podría comprometer un artículo con otras revisiones sólidas.

33
RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

32
RESEARCHarXiv CS.CL·hace 14d

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

El Sistema de Debate Multi-Persona (MPDS) es un marco basado en la literatura para la generación automatizada de hipótesis científicas, diseñado para superar la dificultad de sintetizar conocimiento fragmentado, particularmente en la investigación de materiales para baterías. Combina recuperación de literatura, razonamiento de modelos de lenguaje grandes y debate multiagente para facilitar la negociación entre personas manteniendo la trazabilidad de la evidencia.

32
RESEARCHDEV.to AI·13/4/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Este contenido explora un enfoque novedoso para mejorar el Aprendizaje por Refuerzo para el razonamiento de Modelos de Lenguaje Grandes (LLM) al centrarse en "tokens minoritarios de alta entropía". Propone que estos tokens menos frecuentes pero muy informativos son los impulsores clave para un aprendizaje eficaz, desafiando la regla convencional 80/20.

29
RESEARCHarXiv CS.CL·hace 13d

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Esta investigación presenta la Destilación Auto-Verificada, un algoritmo que permite a los grandes modelos de lenguaje (LLMs) mejorarse a sí mismos utilizando solo indicaciones sin etiquetar. Implica generar, auto-verificar mediante comprobaciones multi-etapa y luego entrenar con conjuntos de datos auto-curados, sin maestros externos.

29
RESEARCHarXiv CS.CL·hace 19d

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Esta investigación explora si las leyes de escalamiento de datos reales están gobernadas por una cobertura progresiva de un espectro latente de contribución predictiva, en lugar de solo por la frecuencia de tokens. Utilizando un autómata de sufijos y un espectro de contribución predictiva global-KL, el estudio encuentra una fuerte correlación entre la pendiente de la cola del espectro y el exponente de escalamiento de datos de los aprendices GPT, demostrando que el rango de truncamiento efectivo escala logarítmicamente.

29
RESEARCHarXiv CS.LG·7/5/2026

Structured Progressive Knowledge Activation for LLM-Driven Neural Architecture Search

Este artículo introduce Structured Progressive Knowledge Activation (SPARK) para abordar el desafío de integrar el conocimiento arquitectónico en la búsqueda de arquitectura neuronal (NAS) impulsada por LLMs. SPARK mitiga el "entanglement funcional" al permitir la edición condicionada por factores, lo que lleva a modificaciones arquitectónicas más específicas y confiables.

29
RESEARCHarXiv CS.AI·hace 29d

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta investigación propone una teoría de "estabilización de preferencia de respuesta finita" para identificar el momento en que la preferencia de respuesta de un modelo de lenguaje se vuelve estable. Muestra que esta estabilización ocurre a menudo antes de que la respuesta sea verbalizada, con un tiempo de anticipación notable.

29
RESEARCHarXiv CS.LG·hace 29d

RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory

Este artículo propone RateQuant, un método para la cuantificación óptima de caché KV de precisión mixta en grandes modelos de lenguaje para abordar los cuellos de botella de memoria. Aborda el desafío de la desajuste del modelo de distorsión, donde aplicar el modelo de distorsión de un cuantificador a otro degrada el rendimiento en comparación con la cuantificación uniforme.

29