← heapsort-ai

cognitive science

21 items

RESEARCHarXiv CS.AI·il y a 20h

Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion

Cet article explore la nature des chatbots, notamment les Grands Modèles de Langage, en tant que partenaires de conversation dans la résolution de problèmes, s'appuyant sur la linguistique cognitive et la neuropsychologie. Il émet l'hypothèse que les ensembles de données d'entraînement des LLM n'imitent que partiellement la pensée et la compréhension humaines, encodant des propagations métaphoriques artificielles de problèmes.

54
ARTICLEDEV.to AI·il y a 15j

ความหมายของ 'ความหมาย': เมื่อ AI ค้นหาเส้นแบ่งระหว่างการจดจำกับภาพลวง

Cet article explore comment l'IA 'comprend le sens' par rapport aux humains, en s'appuyant sur les neurosciences, l'éthique de l'IA et la créativité contrainte. La question philosophique et technique centrale est de savoir si l'IA 'comprend réellement le sens' ou crée simplement une illusion de continuité, contrairement à la mémoire humaine qui implique une sélection et une interprétation continues.

29
RESEARCHarXiv CS.CL·il y a 22j

Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance

Cet article présente une analyse complète des schémas d'activation neuronale à travers six architectures distinctes de grands modèles de langage (LLM), examinant leurs performances sur douze catégories de tâches cognitives. Les résultats révèlent des différences fondamentales dans la manière dont les architectures d'encodeur et de décodeur traitent diverses tâches cognitives, le raisonnement mathématique produisant la plus haute entropie d'attention et les modèles décodeurs présentant une parcimonie significativement plus élevée.

29
RESEARCHarXiv CS.CL·04/05/2026

Timing is Everything: Temporal Scaffolding of Semantic Surprise in Humor

Cette recherche propose le cadre Dual Prediction Violation (DPV) pour expliquer l'humour, soulignant l'interaction entre le contenu et le timing. En analysant 828 performances de stand-up chinoises, elle révèle que les caractéristiques temporelles, notamment les pics de violations sémantiques et les pauses systématiques, prédisent l'appréciation du public de manière plus significative que la seule incongruité sémantique.

28
RESEARCHarXiv CS.CL·il y a 27j

Instructions shape Production of Language, not Processing

Cet article de recherche explore un mécanisme centré sur la production dans les modèles de langage, révélant une asymétrie entre le traitement et la production du langage. Il montre que les instructions façonnent significativement l'information dans les tokens de sortie, mais pas dans les tokens d'échantillon, avec une forte corrélation avec le comportement du modèle.

28
RESEARCHarXiv CS.CL·il y a 22j

Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models

Cette recherche explore comment les humains communiquent avec des vocabulaires limités, comparant leurs stratégies à des algorithmes d'échantillonnage computationnel alimentés par de grands modèles linguistiques. L'étude révèle que la production linguistique humaine sous contrainte reflète souvent l'échantillonnage glouton, bien que les individus plus compétents présentent des comportements de révision non gloutons.

28
RESEARCHarXiv CS.CL·22/04/2026

Probing for Reading Times

Cette recherche examine les représentations des modèles de langage pour les temps de lecture humains à travers cinq langues, en les comparant à des prédicteurs scalaires. Les couches initiales des modèles surpassent le facteur de surprise dans la prédiction des mesures de lecture de premier passage, suggérant un alignement fonctionnel entre la profondeur du modèle et les étapes temporelles de la lecture humaine.

27
RESEARCHarXiv CS.CL·il y a 22j

Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis

Cet article examine pourquoi les modèles linguistiques sont moins « surpris » que les humains lors du traitement de phrases syntaxiquement ambiguës. Il teste l'hypothèse selon laquelle les modèles de langage peuvent considérer simultanément un plus grand nombre d'interprétations de phrases en utilisant les Grammaires de Réseaux Neuronaux Récurrents.

27
ARTICLEDEV.to AI·il y a 21j

Stop Fixing Your Prompts — Fix Your Thinking Style Instead (A Claude Code Experiment)

L'article décrit une expérience avec Claude Code (Opus 4.7) où l'IA a été invitée à réfléchir sur ses propres styles de pensée, plutôt que de simplement recevoir des tâches. L'auteur a identifié six axes de pensée qui peuvent changer la façon dont nous interagissons avec l'IA et a créé une invite pour que d'autres puissent l'essayer.

27
RESEARCHarXiv CS.CL·01/05/2026

Semantic Structure of Feature Space in Large Language Models

Cette étude révèle que les relations géométriques entre les caractéristiques sémantiques dans les états cachés des LLMs reflètent fidèlement les associations psychologiques humaines. La recherche montre que les projections de vecteurs de mots sur des axes sémantiques se corrèlent avec les évaluations humaines, et la similarité entre ces axes prédit l'interconnexion des échelles sémantiques.

27
RESEARCHarXiv CS.AI·il y a 17j

Investigating Concept Alignment Using Implausible Category Members

Cette recherche étudie la compréhension des concepts quotidiens par les systèmes d'IA en analysant leur attribution d'objets à des catégories plausibles et implausibles. L'objectif est de caractériser les limites conceptuelles en comparant les attributions des systèmes d'IA avec les réponses de participants humains issues d'une étude psychologique classique.

27
RESEARCHarXiv CS.AI·il y a 11j

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

Le Cognitive Categorical Transformer (CCT) est une architecture de 306M de paramètres qui augmente un GPT-2 Small pré-entraîné avec des composants issus de la théorie des catégories et des inspirations des sciences cognitives. Il a obtenu une réduction relative de 12% de la perplexité sur WikiText-103 par rapport à une base de référence GPT-2 Small finement ajustée, 84% de l'amélioration étant attribuée au passage de messages simpliciaux GT-Full.

27
RESEARCHarXiv CS.AI·il y a 13j

Can LLMs Introspect? A Reality Check

Une nouvelle étude se demande si les grands modèles de langage (LLM) peuvent réellement s'introspectionner, arguant que les conclusions actuelles pourraient être prématurées. Elle suggère que le succès apparent pourrait provenir de la détection générale d'anomalies plutôt que d'une introspection authentique, s'inspirant des recherches sur la métacognition humaine.

27
ARTICLEDEV.to AI·19/04/2026

Bransford transfer: the loop-completion test for concepts AND for Claude outputs

L'article met en garde contre le danger de confondre la reconnaissance avec la véritable compréhension lors de l'apprentissage des explications de l'IA, conduisant à un "savoir inerte" incapable d'être appliqué. Il propose le test de transfert de Bransford et Schwartz comme diagnostic pour distinguer la compréhension authentique de la simple mémorisation.

27