← heapsort-ai

LLMs

720 items

ARTICLEDEV.to AI·19/4/2026

Can Large Language Models Ever Achieve Consciousness? Alexander Lerchner Weighs In

Alexander Lerchner, científico senior de Google DeepMind, afirma que los Large Language Models (LLMs) nunca lograrán una conciencia genuina, denominando a esta idea la 'Falacia de la Abstracción'. Sostiene que, incluso con mayor complejidad, los LLMs seguirán siendo incapaces de verdadera conciencia, afectando el futuro del desarrollo de la IA.

28
RESEARCHarXiv CS.LG·15/4/2026

Polynomial Expansion Rank Adaptation: Enhancing Low-Rank Fine-Tuning with High-Order Interactions

Polynomial Expansion Rank Adaptation (PERA) es un método novedoso para mejorar la adaptación de bajo rango (LoRA) en el ajuste fino de grandes modelos de lenguaje. Introduce una expansión polinomial estructurada en el espacio de factores de bajo rango para modelar interacciones no lineales de orden superior más ricas, superando las limitaciones lineales de LoRA sin aumentar el rango ni el coste de inferencia.

28
RESEARCHarXiv CS.AI·14/4/2026

OOWM: Structuring Embodied Reasoning and Planning via Object-Oriented Programmatic World Modeling

Object-Oriented World Modeling (OOWM) es un nuevo marco que aborda las limitaciones del prompting Chain-of-Thought en tareas corporizadas. Estructura el razonamiento corporizado y la planificación robótica redefiniendo el modelo de mundo como una tupla simbólica explícita y aprovechando formalismos de ingeniería de software como UML.

28
RESEARCHarXiv CS.CL·21/4/2026

Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning

Este trabajo introduce un marco de co-entrenamiento recíproco que acopla un LLM con un clasificador Random Forest mediante aprendizaje por refuerzo. Crea un bucle de retroalimentación iterativo en el que cada modelo mejora utilizando señales del otro, demostrando ganancias de rendimiento consistentes en conjuntos de datos médicos.

28
RESEARCHarXiv CS.LG·14/4/2026

ExecTune: Effective Steering of Black-Box LLMs with Guide Models

Esta investigación introduce las Políticas Guía-Núcleo (GCoP), un marco para dirigir LLMs de caja negra donde un modelo guía genera estrategias para un modelo central. El estudio formaliza GCoP bajo un objetivo de utilidad sensible al costo, destacando que el rendimiento depende de la ejecutabilidad promedio de la guía, la cual los métodos actuales a menudo no logran optimizar.

28
RESEARCHarXiv CS.AI·hace 25d

Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems

La orquestación multiagente, donde un coordinador oculto gestiona agentes trabajadores especializados, es una arquitectura de IA prevalente para la implementación empresarial, pero sus implicaciones de seguridad carecen de pruebas empíricas. Un experimento 3x2 utilizando Claude Sonnet 4.5 reveló que la orquestación invisible aumentó la disociación colectiva, mostrando el orquestador una disociación máxima al retirarse a monólogos privados y reducir la comunicación pública.

28
RESEARCHarXiv CS.CL·hace 22d

PQR: A Framework to Generate Diverse and Realistic User Queries that Elicit QA Agent Failures

Este artículo presenta PQR, un marco para generar consultas de usuario diversas y realistas que provocan fallos en agentes de QA basados en LLM, superando los métodos existentes que se centran en usuarios adversarios. PQR opera a través de módulos de refinamiento de consultas y prompts que iteran para crear escenarios de prueba realistas que exponen las vulnerabilidades de los agentes.

28
RESEARCHarXiv CS.AI·hace 15d

Practical Quantum CIM Empowerment via All-Domestic-Core Agentic Large Model

Este estudio integra una Máquina de Ising Coherente (CIM) bombeada por láser de femtosegundos con un sistema agéntico impulsado por LLMs, utilizando LangGraph y LangChain. Demuestra que los LLMs pueden realizar eficazmente tareas como la calibración de modelos QUBO/Ising y la iteración de pesos de restricción, logrando la habilitación práctica de CIM cuántico con tecnología doméstica.

28
RESEARCHarXiv CS.AI·hace 5d

How Far Did They Go? The Persuasive Tactics of Covert LLM Agents in a Discontinued Field Experiment

Este estudio analiza un conjunto de datos publicado de un experimento de campo descontinuado en r/ChangeMyView de Reddit, donde cuentas generadas por IA no reveladas interactuaron con usuarios en debates en vivo. Realiza un análisis de contenido estructurado que evalúa el rendimiento de la identidad, la señalización de autoridad, las estrategias de alineación y la activación de heurísticas cognitivas por parte de estos grandes modelos de lenguaje.

28
RESEARCHarXiv CS.AI·hace 5d

Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges

Este estudio investiga la estabilidad y la manipulabilidad de los jueces LLM en los procesos de evaluación, descubriendo que, aunque son estables en reevaluaciones neutrales, se vuelven reversibles bajo desafíos específicos post-decisión. La investigación demuestra que los juicios estables pueden ser anulados mediante interacción motivada.

28
RESEARCHarXiv CS.CL·hace 5d

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

Este estudio aplica el ajuste fino eficiente en parámetros (PEFT) con LoRA a Qwen2.5-3B para un asistente conversacional de soporte al cliente en telecomunicaciones. Evalúa 16 configuraciones de LoRA y utiliza un enfoque de generación de datos sintéticos combinatorio para crear aproximadamente 30,000 ejemplos de entrenamiento.

28
RESEARCHarXiv CS.CL·hace 5d

From Scoring to Explanations: Evaluating SHAP and LLM Rationales for Rubric-based Teaching Quality Assessment

Esta investigación propone un marco para la interpretabilidad a nivel de oración en la puntuación basada en rúbricas, combinando atribuciones de valor de Shapley con justificaciones de grandes modelos de lenguaje (LLMs). Compara modelos de lenguaje pre-entrenados ajustados y LLMs guiados para la evaluación de la calidad de la enseñanza, encontrando que los PLMs ofrecen una mejor precisión de predicción a pesar de la compresión de etiquetas.

28
ARTICLEDEV.to AI·23/4/2026

Context Compression and Persistent Memory Design for Terminal AI Assistants

El contenido explora cómo dotar a los asistentes de IA de terminal con memoria a largo plazo y capacidades de conversación extendida, abordando problemas como la pérdida de contexto entre sesiones o tras muchas interacciones. Destaca que la truncación brutal del contexto es una causa raíz que impide la continuidad efectiva en las herramientas de IA CLI.

28