← heapsort-ai

cognitive science

21 items

RESEARCHarXiv CS.AI·20h atrás

Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion

Este artigo examina a natureza dos chatbots, especialmente os Modelos de Linguagem Grandes (LLMs), como parceiros de conversação na resolução de problemas, utilizando perspetivas da Linguística Cognitiva e Neuropsicologia. A pesquisa levanta a hipótese de que os dados de treino dos LLMs imitam apenas parcialmente o pensamento e a compreensão humanos, codificando propagações metafóricas artificiais de problemas.

54
ARTICLEDEV.to AI·15d atrás

ความหมายของ 'ความหมาย': เมื่อ AI ค้นหาเส้นแบ่งระหว่างการจดจำกับภาพลวง

Este artigo explora como a IA 'compreende o significado' em comparação com os humanos, utilizando perspetivas da neurociência, ética da IA e criação restrita. A questão central é se a IA realmente 'entende o significado' ou apenas cria uma ilusão de continuidade, ao contrário da memória humana que envolve seleção e interpretação contínuas.

29
RESEARCHarXiv CS.AI·29d atrás

When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment

Esta pesquisa introduz uma teoria de "estabilização de preferência de resposta finita" para determinar quando a preferência de resposta de um modelo de linguagem se torna estável. Ela demonstra que esta estabilização frequentemente ocorre antes que a resposta seja explicitamente verbalizada, com um tempo de antecipação considerável.

29
RESEARCHarXiv CS.CL·22d atrás

Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance

Este artigo apresenta uma análise abrangente dos padrões de ativação neural em seis arquiteturas distintas de modelos de linguagem grandes (LLMs), examinando seu desempenho em doze categorias de tarefas cognitivas. Os achados revelam diferenças fundamentais em como as arquiteturas de encoder e decoder processam tarefas diversas, com o raciocínio matemático gerando a maior entropia de atenção e modelos decodificadores exibindo maior esparsidade.

29
ARTICLEDEV.to AI·15d atrás

The Meaning of 'Meaning': When AI Seeks the Line Between Recognition and Illusion

Este artigo explora como a inteligência artificial pode "entender o significado" em comparação com os humanos, abordando a questão através das lentes da neurociência, ética da IA e criatividade limitada. Conclui que a IA não pode compreender o significado como os humanos, pois carece de experiência incorporada e cultural.

28
RESEARCHarXiv CS.CL·04/05/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Esta pesquisa propõe o framework Dual Prediction Violation (DPV) para explicar o humor, destacando a interação entre conteúdo e tempo. Analisando 828 performances de stand-up chinesas, ela revela que características temporais, como picos de violações semânticas e pausas sistemáticas, preveem a apreciação do público mais significativamente do que apenas a incongruência semântica.

28
RESEARCHarXiv CS.CL·22d atrás

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Esta pesquisa explora como os humanos se comunicam com vocabulários limitados, comparando suas estratégias a algoritmos de amostragem computacional impulsionados por grandes modelos de linguagem. O estudo revela que a produção de linguagem humana sob restrição frequentemente espelha a amostragem gulosa, embora indivíduos mais habilidosos exibam comportamentos de revisão não gulosos.

28
RESEARCHarXiv CS.CL·22/04/2026

Probing for Reading Times

Esta pesquisa investiga as representações de modelos de linguagem para tempos de leitura humanos em cinco idiomas, comparando-as com preditores escalares. Os resultados indicam que as camadas iniciais dos modelos superam o fator de 'surprisal' na previsão de medidas de leitura de primeira passagem, sugerindo um alinhamento funcional entre a profundidade do modelo e os estágios temporais da leitura humana.

27
RESEARCHarXiv CS.CL·01/05/2026

Semantic Structure of Feature Space in Large Language Models

Este estudo revela que as relações geométricas entre características semânticas nas representações internas de LLMs espelham fielmente as associações psicológicas humanas. A pesquisa demonstra que a projeção de vetores de palavras em eixos semânticos se correlaciona com avaliações humanas, e a similaridade entre esses eixos prevê a interconexão das escalas semânticas.

27
RESEARCHarXiv CS.AI·11d atrás

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

O Cognitive Categorical Transformer (CCT) é uma arquitetura de 306M parâmetros que aumenta um GPT-2 Small pré-treinado com componentes baseados na teoria das categorias e inspirações da ciência cognitiva. Ele alcançou uma redução relativa de 12% na perplexidade no WikiText-103 em comparação com um GPT-2 Small de linha de base, com 84% da melhoria atribuída à passagem de mensagens simplificadas GT-Full.

27
RESEARCHarXiv CS.AI·13d atrás

Can LLMs Introspect? A Reality Check

Um novo estudo questiona se os grandes modelos de linguagem (LLMs) podem verdadeiramente introspectar, argumentando que as conclusões atuais podem ser prematuras. Ele sugere que o sucesso aparente pode ser devido à detecção de anomalias gerais, e não a uma introspecção genuína, com base em lições da pesquisa em metacognição humana.

27