← heapsort-ai

AI Research

146 items

RESEARCHarXiv CS.CL·hace 19h

Bidirectional Small-Granularity Search between Code and Text

Esta investigación presenta una nueva tarea de búsqueda bidireccional de granularidad pequeña entre código y texto, con el objetivo de vincular publicaciones científicas con segmentos de código correspondientes. Propone un gran conjunto de datos, parcialmente generado por GPT-4, y un enfoque modular que logra buenos resultados.

54
RESEARCHarXiv CS.CL·hace 19h

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA propone un nuevo marco para la Recomendación con Grandes Modelos de Lenguaje (LLMRec) que integra información estructural con semántica textual. Para ello, incrusta una red de paso de mensajes de grafos entrenable dentro de la vía de adaptación de bajo rango, permitiendo que la topología colaborativa guíe explícitamente las actualizaciones de los parámetros.

54
RESEARCH↑ trendingReddit r/MachineLearning·hace 27d

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Los grandes modelos de lenguaje (LLM) enfrentan el olvido catastrófico y la pérdida de plasticidad al actualizar sus parámetros para tareas específicas. Este trabajo introduce un marco de aprendizaje "rápido-lento" para LLM, utilizando los parámetros del modelo como pesos lentos y el contexto optimizado como pesos rápidos para adaptarse eficientemente sin comprometer el razonamiento general.

42
ARTICLE↑ trendingReddit r/MachineLearning·30/4/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

El contenido describe un desalineamiento percibido en el proceso de revisión de ICML, donde los revisores se sienten presionados a homogeneizar las puntuaciones para evitar discusiones prolongadas, lo que podría llevar al rechazo de artículos positivos. Destaca la reticencia de los revisores a actualizar las puntuaciones incluso después de abordar las preocupaciones, creando dinámicas distorsionadas.

42
RESEARCH↑ trendingReddit r/MachineLearning·hace 19d

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Esta discusión cuestiona si los Modelos de Lenguaje Visual (VLMs) en producción aún utilizan ViTs de parche fijo para sus capacidades de visión, a pesar de la existencia de métodos de tokenización más eficientes. Explora posibles razones para esto, como ganancias marginales, limitaciones de tubería o leyes de escala no claras para el "patching" adaptativo.

42
RESEARCHarXiv CS.CL·hace 1d

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

La Hipótesis Piggyback explica cómo los tokens de plantilla de chat pueden causar desalineación emergente en LLMs, generalizando el comportamiento ajustado a consultas fuera del dominio. Se propone la técnica Token-Regularized Finetuning (TReFT) para mitigar este problema, preservando el aprendizaje en el dominio y reduciendo la desalineación.

41
ARTICLE↑ trendingReddit r/MachineLearning·18/4/2026

ICML 2026 - Heavy score variance among various batches? [D]

Una publicación en Reddit discute la gran variación en las puntuaciones de los artículos entre diferentes lotes de revisión para ICML 2026, con algunos lotes teniendo pocas puntuaciones altas y otros promedios más altos. El usuario pregunta por las razones de esta disparidad, como diferencias de dominio o revisores más estrictos, y si ICML lo tiene en cuenta.

41
ARTICLE↑ trendingReddit r/MachineLearning·19/4/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un estudiante universitario pregunta sobre las perspectivas futuras y la adopción de las Redes Neuronales Spiking y las Redes Neuronales Líquidas, cuestionando si son áreas prometedoras para el aprendizaje y proyectos. El usuario busca discutir el potencial de estas tecnologías de computación neuromórfica.

38
NEWS↑ trendingReddit r/MachineLearning·23/4/2026

UAI 2026 Reviews Waiting Place [D]

Este es un espacio para que los participantes de UAI 2026 compartan sus reacciones, ya sean quejas o alivio, una vez que las revisiones de la conferencia se publiquen pronto. Se desea buena suerte a todos con sus resultados.

37