AI Research

146 items

ARTICLE↑ trendingReddit r/MachineLearning·17/4/2026

SIGIR-AP: Good conference for IR? [D]

Un investigador universitario interesado en Recuperación de Información (IR) busca consejo sobre conferencias académicas menos competitivas para enviar su trabajo. Pregunta si SIGIR-AP, una conferencia nueva respaldada por SIGIR, es una buena opción y pide otras sugerencias.

research academic conferences Information Retrieval AI Research

ARTICLE↑ trendingReddit r/MachineLearning·11/4/2026

Post Rebuttal ICML Average Scores? [D]

Un autor comparte su frustración con el proceso de evaluación del ICML, destacando una puntuación media de 3.5 y el cambio en la evaluación de un revisor. Señala que una puntuación de 4.2, según el "Paper Co-Pilot", solo sitúa un artículo en el 40% superior.

Academic Publication Paper Co-Pilot paper review ICML

ARTICLE↑ trendingReddit r/MachineLearning·20/4/2026

Does submitting to only journals negatively affect research career after finishing PhD? [D]

El contenido pregunta si publicar únicamente en revistas de ML (como TMLR, JMLR) en lugar de conferencias afecta negativamente las oportunidades de empleo para puestos de científico de investigación de ML en empresas, considerando la percibida imparcialidad de los procesos de revisión de las revistas. La discusión se centra en carreras corporativas post-doctorado.

hiring AI Research

NEWS↑ trendingReddit r/MachineLearning·12/4/2026

"There's a new generation of empirical deep learning researchers, hacking away at whatever seems trendy, blowing with the wind" [D]

El contenido critica a la nueva generación de investigadores de deep learning por seguir tendencias. El autor busca una discusión sobre el complejo término 'IA post-agéntica', con el cual tiene dificultades.

AI trends deep learning post-agentic AI AI concepts

ARTICLE↑ trendingReddit r/MachineLearning·21/4/2026

[NeurIPS 2026] Will you be submitting your code alongside your submissions? [D]

Este contenido aborda una discusión sobre la presentación de código junto con artículos para NeurIPS 2026, con el autor dividido entre el aumento de credibilidad y la preocupación por el plagio. La publicación busca la opinión de la comunidad sobre esta práctica.

code submission academic-ethics plagiarism research integrity

ARTICLE↑ trendingReddit r/MachineLearning·16/4/2026

[ICML 2026] Scores increased and then decreased!! [D]

Un autor de un artículo para ICML está preocupado porque un revisor aumentó su puntuación después de la réplica, pero luego la redujo de nuevo a la puntuación original. La disminución de la puntuación promedio del artículo le hace temer un rechazo temprano.

Peer review academic conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·1/5/2026

ICML 2026 Position Track Decision [D]

El usuario propone crear un hilo de discusión separado para la sección de 'position papers' del ICML 2026, temiendo que las discusiones sobre esta sección menor se diluyan en el hilo principal. El objetivo es facilitar la toma de decisiones sobre esta sección específica.

machine learning academic discourse Conference AI Research

ARTICLE↑ trendingReddit r/MachineLearning·13/4/2026

[ICML 2026] Extending the deadline for reviewer final justifications while not extending for Author-AC comments was a huge mistake [D]

El autor critica la decisión de extender el plazo para las justificaciones finales de los revisores en ICML 2026 sin extender el plazo para que los autores contacten a los ACs, considerándola un gran error. Un revisor planteó nuevas cuestiones críticas en su justificación final, no mencionadas anteriormente, lo que podría comprometer un artículo con otras revisiones sólidas.

deadlines ICML Peer review academic conference

RESEARCHarXiv CS.CL·22/4/2026

Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models

Este artículo propone una nueva técnica, Token-to-Mask (T2M) remasking, para refinar modelos de lenguaje de difusión enmascarados como LLaDA2.1. El método aborda las deficiencias de la edición Token-to-Token (T2T) al restablecer los tokens sospechosos a un estado de máscara, permitiendo una predicción más precisa.

Diffusion Models language models error correction Natural Language Processing

RESEARCHarXiv CS.CL·hace 14d

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

El Sistema de Debate Multi-Persona (MPDS) es un marco basado en la literatura para la generación automatizada de hipótesis científicas, diseñado para superar la dificultad de sintetizar conocimiento fragmentado, particularmente en la investigación de materiales para baterías. Combina recuperación de literatura, razonamiento de modelos de lenguaje grandes y debate multiagente para facilitar la negociación entre personas manteniendo la trazabilidad de la evidencia.

Materials Science Scientific Discovery multi-agent systems AI Research

RESEARCHDEV.to AI·18/4/2026

Density-aware Chamfer Distance as a Comprehensive Metric for Point CloudCompletion

Este contenido presenta la "Density-aware Chamfer Distance" como una nueva métrica integral para la evaluación de tareas de completado de nubes de puntos. Busca proporcionar una valoración más robusta y precisa de los modelos 3D completados.

3D reconstruction point cloud Metrics computer vision

RESEARCHarXiv CS.CL·23/4/2026

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

Una nueva investigación sugiere que las "neuronas de alucinación" (H-neurons) que predicen alucinaciones en LLMs no se generalizan entre diferentes dominios de conocimiento. Esto implica que la alucinación podría no ser un mecanismo único con una firma neural universal, sino dependiente del contexto.

LLMs hallucination AI safety AI Research

RESEARCHDEV.to AI·13/4/2026

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive EffectiveReinforcement Learning for LLM Reasoning

Este contenido explora un enfoque novedoso para mejorar el Aprendizaje por Refuerzo para el razonamiento de Modelos de Lenguaje Grandes (LLM) al centrarse en "tokens minoritarios de alta entropía". Propone que estos tokens menos frecuentes pero muy informativos son los impulsores clave para un aprendizaje eficaz, desafiando la regla convencional 80/20.

Token Analysis reinforcement learning Natural Language Processing LLM reasoning

RESEARCHarXiv CS.CL·hace 13d

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Esta investigación presenta la Destilación Auto-Verificada, un algoritmo que permite a los grandes modelos de lenguaje (LLMs) mejorarse a sí mismos utilizando solo indicaciones sin etiquetar. Implica generar, auto-verificar mediante comprobaciones multi-etapa y luego entrenar con conjuntos de datos auto-curados, sin maestros externos.

distillation learning self-training AI Research

RESEARCHarXiv CS.CL·hace 19d

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Esta investigación explora si las leyes de escalamiento de datos reales están gobernadas por una cobertura progresiva de un espectro latente de contribución predictiva, en lugar de solo por la frecuencia de tokens. Utilizando un autómata de sufijos y un espectro de contribución predictiva global-KL, el estudio encuentra una fuerte correlación entre la pendiente de la cola del espectro y el exponente de escalamiento de datos de los aprendices GPT, demostrando que el rango de truncamiento efectivo escala logarítmicamente.

language models data scaling machine learning predictive models

RESEARCHarXiv CS.LG·7/5/2026

Structured Progressive Knowledge Activation for LLM-Driven Neural Architecture Search

Este artículo introduce Structured Progressive Knowledge Activation (SPARK) para abordar el desafío de integrar el conocimiento arquitectónico en la búsqueda de arquitectura neuronal (NAS) impulsada por LLMs. SPARK mitiga el "entanglement funcional" al permitir la edición condicionada por factores, lo que lleva a modificaciones arquitectónicas más específicas y confiables.

Neural Architecture Search machine learning Knowledge Integration large language models

RESEARCHDEV.to AI·hace 4d

Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration

Este contenido analiza un artículo de investigación centrado en el uso del contexto episódico y mundos persistentes para la exploración 3D en sistemas de IA. Señala un cambio relevante en el campo de la inteligencia artificial, respaldado por datos y análisis.

persistent worlds episodic context AI Research 3D exploration

RESEARCHarXiv CS.LG·8/5/2026

Structural Instability of Feature Composition

El artículo introduce un marco geométrico para analizar la inestabilidad de la unión de características en Autoencoders Escasos (SAEs), centrándose en la dirección composicional. Deriva un umbral asintótico de colapso composicional bajo un modelo de diccionario esférico.

Feature Composition Transformer architectures Sparse autoencoders AI Research

RESEARCHarXiv CS.AI·hace 29d

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta investigación propone una teoría de "estabilización de preferencia de respuesta finita" para identificar el momento en que la preferencia de respuesta de un modelo de lenguaje se vuelve estable. Muestra que esta estabilización ocurre a menudo antes de que la respuesta sea verbalizada, con un tiempo de anticipación notable.

language models cognitive science machine learning NLP

RESEARCHarXiv CS.LG·hace 29d

RateQuant: Optimal Mixed-Precision KV Cache Quantization via Rate-Distortion Theory

Este artículo propone RateQuant, un método para la cuantificación óptima de caché KV de precisión mixta en grandes modelos de lenguaje para abordar los cuellos de botella de memoria. Aborda el desafío de la desajuste del modelo de distorsión, donde aplicar el modelo de distorsión de un cuantificador a otro degrada el rendimiento en comparación con la cuantificación uniforme.

Memory Optimization quantization AI Research LLM