AI Research

146 items

RESEARCHDEV.to AI·hace 10h

Aligning with Human Judgement: The Role of Pairwise Preference in Large LanguageModel Evaluators

Este contenido explora el papel crítico de la preferencia por pares en la evaluación de Grandes Modelos de Lenguaje (LLM). Discute cómo este método puede ayudar a alinear el rendimiento de los LLM de manera más efectiva con el juicio humano.

Human Alignment Pairwise Preference natural language processing AI Research

RESEARCHarXiv CS.AI·hace 19h

Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

Los grandes modelos de lenguaje (LLM) enfrentan una limitación llamada 'cuello de botella de concepto', donde pierden hechos críticos en razonamientos latentes profundos. Este artículo propone AGCLR para abordar esto, aumentando CoCoNuT con un flujo de concepto con puerta para memoria persistente.

machine learning Latent Reasoning Reasoning AI Research

RESEARCHarXiv CS.CL·hace 19h

Bidirectional Small-Granularity Search between Code and Text

Esta investigación presenta una nueva tarea de búsqueda bidireccional de granularidad pequeña entre código y texto, con el objetivo de vincular publicaciones científicas con segmentos de código correspondientes. Propone un gran conjunto de datos, parcialmente generado por GPT-4, y un enfoque modular que logra buenos resultados.

machine learning natural language processing Code Analysis Information Retrieval

RESEARCHarXiv CS.CL·hace 19h

GraphLoRA: Structure-Aware Low-Rank Adaptation for Large Language Model Recommendation

GraphLoRA propone un nuevo marco para la Recomendación con Grandes Modelos de Lenguaje (LLMRec) que integra información estructural con semántica textual. Para ello, incrusta una red de paso de mensajes de grafos entrenable dentro de la vía de adaptación de bajo rango, permitiendo que la topología colaborativa guíe explícitamente las actualizaciones de los parámetros.

Low-Rank Adaptation Graph Neural Networks Recommendation Systems AI Research

ARTICLE↑ trendingHacker News (AI)·hace 4d

Sakana AI's Recursive Self-Improvement (RSI) Lab

Sakana AI ha lanzado su Laboratorio de Auto-Mejora Recursiva (RSI), con el objetivo de desarrollar modelos de IA capaces de mejorar su propio rendimiento. Esta iniciativa se centra en la investigación fundamental para crear sistemas de IA más robustos y adaptables.

Self-improvement AI Sakana AI machine learning AI development

ARTICLE↑ trendingHacker News (AI)·hace 4d

Ask HN: AI researchers – what's a recent paper that recently blew your mind?

Un usuario de Hacker News pide a investigadores de IA que compartan artículos recientes de aprendizaje automático que les hayan impactado. El objetivo es descubrir publicaciones nuevas y emocionantes en el ámbito del ML para aquellos que buscan novedades.

Academic Papers Research Recommendations machine learning AI

RESEARCH↑ trendingReddit r/MachineLearning·hace 27d

Learning, Fast and Slow: Towards LLMs That Adapt Continually [R]

Los grandes modelos de lenguaje (LLM) enfrentan el olvido catastrófico y la pérdida de plasticidad al actualizar sus parámetros para tareas específicas. Este trabajo introduce un marco de aprendizaje "rápido-lento" para LLM, utilizando los parámetros del modelo como pesos lentos y el contexto optimizado como pesos rápidos para adaptarse eficientemente sin comprometer el razonamiento general.

LLMs learning Catastrophic Forgetting AI Research

ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

SGOCR: A Spatially-Grounded OCR-focused Pipeline & V1 Dataset [P]

Un investigador independiente creó SGOCR, una pipeline de dataset de código abierto centrada en OCR y VQA con base espacial, para cubrir una brecha en los datasets visuales para la conexión de texto en imágenes. Esta pipeline genera tuplas VQA con metadatos enriquecidos, soportando diversas estrategias de entrenamiento de VLM.

Open Source Vision-Language Models datasets OCR

ARTICLE↑ trendingReddit r/MachineLearning·12/4/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Este contenido discute la perspectiva de que los Large Language Models (LLMs) aprenden de manera inversa y que la hipótesis de escalabilidad tiene límites inherentes.

LLMs deep learning scaling hypothesis modelos de linguagem

RESEARCH↑ trendingReddit r/MachineLearning·hace 26d

Follow the Mean: Reference-Guided Flow Matching [R]

Este contenido se refiere a un artículo de investigación titulado "Follow the Mean: Reference-Guided Flow Matching". Explora una nueva metodología en modelos generativos.

deep learning generative models machine learning Flow Matching

Follow the Mean: Reference-Guided Flow Matching [R]

ARTICLE↑ trendingReddit r/MachineLearning·30/4/2026

Seems ICML is rejecting MANY unanimous positively rated papers [D]

El contenido describe un desalineamiento percibido en el proceso de revisión de ICML, donde los revisores se sienten presionados a homogeneizar las puntuaciones para evitar discusiones prolongadas, lo que podría llevar al rechazo de artículos positivos. Destaca la reticencia de los revisores a actualizar las puntuaciones incluso después de abordar las preocupaciones, creando dinámicas distorsionadas.

Peer review academic conference AI Research

RESEARCH↑ trendingReddit r/MachineLearning·hace 19d

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Esta discusión cuestiona si los Modelos de Lenguaje Visual (VLMs) en producción aún utilizan ViTs de parche fijo para sus capacidades de visión, a pesar de la existencia de métodos de tokenización más eficientes. Explora posibles razones para esto, como ganancias marginales, limitaciones de tubería o leyes de escala no claras para el "patching" adaptativo.

VLMs deep learning Vision Transformers Tokenization

ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

Are we optimizing AI research for acceptance rather than lasting value? [D]

El título cuestiona si la investigación en IA se está optimizando para la aceptación inmediata en lugar de un valor duradero. Esto provoca una discusión crítica sobre la dirección y las prioridades de la innovación en inteligencia artificial.

Innovation Research methodology long-term value AI Research

NEWS↑ trendingReddit r/MachineLearning·19/4/2026

KDD 2026 Cycle 2 reviews seem to have vanished from author view [D]

Un usuario de KDD 2026 informó que las revisiones y discusiones de su artículo enviado han desaparecido de su vista de autor, mientras que puede ver las discusiones de otros artículos como revisor. Pregunta si otros autores están experimentando el mismo problema técnico en la plataforma de revisión.

KDD Peer review academic conference AI Research

RESEARCHarXiv CS.CL·hace 1d

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

La Hipótesis Piggyback explica cómo los tokens de plantilla de chat pueden causar desalineación emergente en LLMs, generalizando el comportamiento ajustado a consultas fuera del dominio. Se propone la técnica Token-Regularized Finetuning (TReFT) para mitigar este problema, preservando el aprendizaje en el dominio y reduciendo la desalineación.

Finetuning Emergent Misalignment LLMs Generalization

ARTICLE↑ trendingReddit r/MachineLearning·hace 26d

Would a 2000-2021 ML paper even get accepted today? [D]

El contenido debate si los artículos de aprendizaje automático aceptados entre 2000 y 2021 serían aprobados hoy, sugiriendo que el nivel de exigencia ha aumentado significativamente. Se discute si el estándar de investigación ha subido o si el campo se ha vuelto más concurrido y competitivo.

machine learning competition Peer review academic research

ARTICLE↑ trendingReddit r/MachineLearning·18/4/2026

ICML 2026 - Heavy score variance among various batches? [D]

Una publicación en Reddit discute la gran variación en las puntuaciones de los artículos entre diferentes lotes de revisión para ICML 2026, con algunos lotes teniendo pocas puntuaciones altas y otros promedios más altos. El usuario pregunta por las razones de esta disparidad, como diferencias de dominio o revisores más estrictos, y si ICML lo tiene en cuenta.

academic conferences Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·27/4/2026

What do reviewers actually mean when they say the paper sound more like a technical report? [D]

El artículo de un autor fue rechazado de un taller por sonar más a informe técnico que a artículo de investigación, a pesar de seguir el formato habitual de visión por computadora. Busca la opinión de la comunidad para entender los errores comunes que conducen a tal evaluación.

academic publishing computer vision Peer review AI Research

ARTICLE↑ trendingReddit r/MachineLearning·19/4/2026

What are the future prospects of Spiking Neural Networks (and particularly, neuromorphics computing) and Liquid Neural Networks? [D]

Un estudiante universitario pregunta sobre las perspectivas futuras y la adopción de las Redes Neuronales Spiking y las Redes Neuronales Líquidas, cuestionando si son áreas prometedoras para el aprendizaje y proyectos. El usuario busca discutir el potencial de estas tecnologías de computación neuromórfica.

Spiking Neural Networks deep learning Liquid Neural Networks Neuromorphic Computing

NEWS↑ trendingReddit r/MachineLearning·23/4/2026

UAI 2026 Reviews Waiting Place [D]

Este es un espacio para que los participantes de UAI 2026 compartan sus reacciones, ya sean quejas o alivio, una vez que las revisiones de la conferencia se publiquen pronto. Se desea buena suerte a todos con sus resultados.

conferences Peer review AI Research