← heapsort-ai

cognitive science

21 items

RESEARCHarXiv CS.AI·hace 20h

Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion

Este artículo examina la naturaleza de los chatbots, especialmente los Grandes Modelos de Lenguaje, como socios conversacionales en la resolución de problemas, basándose en la Lingüística Cognitiva y la Neuropsicología. Hipotetiza que los conjuntos de datos de entrenamiento de LLMs solo imitan parcialmente el pensamiento y la comprensión humanos, codificando propagaciones metafóricas artificiales de problemas.

54
ARTICLEDEV.to AI·hace 15d

ความหมายของ 'ความหมาย': เมื่อ AI ค้นหาเส้นแบ่งระหว่างการจดจำกับภาพลวง

Este artículo explora cómo la IA 'comprende el significado' en comparación con los humanos, a través de la neurociencia, la ética de la IA y la creatividad restringida. La cuestión central es si la IA realmente 'entiende el significado' o simplemente crea una ilusión de continuidad, a diferencia de la memoria humana que implica selección e interpretación continuas.

29
RESEARCHarXiv CS.AI·hace 29d

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta investigación propone una teoría de "estabilización de preferencia de respuesta finita" para identificar el momento en que la preferencia de respuesta de un modelo de lenguaje se vuelve estable. Muestra que esta estabilización ocurre a menudo antes de que la respuesta sea verbalizada, con un tiempo de anticipación notable.

29
RESEARCHarXiv CS.CL·hace 22d

Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance

Este artículo presenta un análisis exhaustivo de los patrones de activación neural en seis arquitecturas distintas de modelos de lenguaje grandes (LLM), examinando su rendimiento en doce categorías de tareas cognitivas. Los hallazgos revelan diferencias fundamentales en cómo las arquitecturas de codificador y decodificador procesan diversas tareas cognitivas, con el razonamiento matemático produciendo la mayor entropía de atención y los modelos decodificadores mostrando una esparsidad significativamente mayor.

29
ARTICLEDEV.to AI·hace 15d

The Meaning of 'Meaning': When AI Seeks the Line Between Recognition and Illusion

Este artículo investiga cómo la inteligencia artificial podría "entender el significado" en comparación con los humanos, abordando la cuestión a través de la neurociencia, la ética de la IA y la creatividad limitada. Concluye que la IA no puede captar el significado como los humanos, ya que carece de experiencia encarnada y cultural.

28
RESEARCHarXiv CS.CL·4/5/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Esta investigación propone el marco Dual Prediction Violation (DPV) para explicar el humor, enfatizando la interacción entre contenido y tiempo. Al analizar 828 actuaciones de stand-up chinas, muestra que las características temporales, especialmente las violaciones semánticas máximas y las pausas sistemáticas, predicen la apreciación de la audiencia de manera más significativa que la incongruencia semántica por sí sola.

28
RESEARCHarXiv CS.CL·hace 27d

Instructions shape Production of Language, not Processing

Este artículo de investigación explora un mecanismo centrado en la producción en modelos de lenguaje, revelando una asimetría entre el procesamiento y la producción del lenguaje. Demuestra que las instrucciones moldean significativamente la información en los tokens de salida, pero no en los de entrada, correlacionándose fuertemente con el comportamiento del modelo.

28
RESEARCHarXiv CS.CL·hace 22d

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Esta investigación explora cómo los humanos se comunican con vocabularios limitados, comparando sus estrategias con algoritmos de muestreo computacional impulsados por grandes modelos de lenguaje. El estudio revela que la producción del lenguaje humano bajo restricciones a menudo refleja el muestreo codicioso, aunque los individuos más hábiles muestran comportamientos de revisión no codiciosos.

28
RESEARCHarXiv CS.CL·22/4/2026

Probing for Reading Times

Esta investigación explora las representaciones de modelos de lenguaje para los tiempos de lectura humanos en cinco idiomas, comparándolas con predictores escalares. Se encuentra que las capas tempranas de los modelos superan a la sorpresa en la predicción de medidas de lectura de primera pasada, sugiriendo una alineación funcional entre la profundidad del modelo y las etapas temporales de la lectura humana.

27
RESEARCHarXiv CS.CL·hace 22d

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Este artículo investiga por qué los modelos de lenguaje muestran menos "sorpresa" que los humanos al procesar oraciones sintácticamente ambiguas. Prueba la hipótesis de que los LMs pueden considerar simultáneamente un mayor número de interpretaciones de oraciones utilizando Gramáticas de Red Neuronal Recurrente.

27
ARTICLEDEV.to AI·hace 21d

Stop Fixing Your Prompts — Fix Your Thinking Style Instead (A Claude Code Experiment)

El artículo describe un experimento con Claude Code (Opus 4.7) donde se le pidió a la IA que reflexionara sobre sus propios estilos de pensamiento, en lugar de solo asignarle tareas. El autor identificó seis ejes de pensamiento que pueden cambiar la forma en que interactuamos con la IA y creó un prompt para que otros lo prueben.

27
RESEARCHarXiv CS.CL·1/5/2026

Semantic Structure of Feature Space in Large Language Models

Este estudio demuestra que las relaciones geométricas entre las características semánticas en los estados ocultos de los LLMs reflejan fielmente las asociaciones psicológicas humanas. La investigación muestra que las proyecciones de vectores de palabras en ejes semánticos se correlacionan con las valoraciones humanas, y la similitud entre estos ejes predice la interconexión de las escalas semánticas.

27
RESEARCHarXiv CS.AI·hace 17d

Investigating Concept Alignment Using Implausible Category Members

Esta investigación explora la comprensión de conceptos cotidianos por parte de los sistemas de IA, analizando su asignación de objetos a categorías plausibles e implausibles. El estudio busca caracterizar los límites conceptuales comparando las asignaciones de los sistemas de IA con las respuestas de participantes humanos de un estudio psicológico clásico.

27
RESEARCHarXiv CS.AI·hace 11d

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

El Cognitive Categorical Transformer (CCT) es una arquitectura de 306M parámetros que aumenta un GPT-2 Small preentrenado con componentes derivados de la teoría de categorías e inspiraciones de la ciencia cognitiva. Logró una reducción relativa del 12% en la perplejidad en WikiText-103 en comparación con un GPT-2 Small de referencia, atribuyéndose el 84% de la mejora al paso de mensajes simplistas de GT-Full.

27
RESEARCHarXiv CS.AI·hace 13d

Can LLMs Introspect? A Reality Check

Un nuevo estudio cuestiona si los grandes modelos de lenguaje (LLMs) pueden realmente introspectar, argumentando que las conclusiones actuales pueden ser prematuras. Sugiere que el éxito aparente podría deberse a la detección general de anomalías en lugar de una introspección genuina, basándose en lecciones de la investigación sobre metacognición humana.

27