← heapsort-ai

model behavior

6 items

RESEARCHarXiv CS.AI·il y a 1j

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Cet article de position plaide pour une compréhension scientifique de l'IA qui se concentre sur l'étude des dynamiques d'entraînement, plutôt que sur la simple analyse des modèles après l'entraînement. Il souligne l'importance de prédire les résultats, d'intervenir en cas de problèmes et de concevoir des procédures d'entraînement pour produire des propriétés souhaitées de manière fiable, en étendant le succès des lois d'échelle au-delà de la perte, aux capacités, aux biais, à la robustesse et à la sécurité.

60
ARTICLE↑ trendingReddit r/LocalLLaMA·23/04/2026

POV Qwen 3.5 with thinking

Ce contenu aborde le comportement du modèle d'IA Qwen 3.5, qui se retrouve fréquemment bloqué dans des boucles de pensée. L'auteur fait une observation brève et informelle sur cette caractéristique du modèle.

POV Qwen 3.5 with thinking
47
RESEARCHarXiv CS.CL·27/04/2026

Shared Lexical Task Representations Explain Behavioral Variability In LLMs

Cette recherche examine la sensibilité des LLM aux prompts en comparant les styles d'instructions et d'exemples. Elle révèle que, malgré de grandes variations de performance, les LLM partagent des mécanismes sous-jacents communs, notamment des "lexical task heads" qui décrivent la tâche et déclenchent la production de réponses.

29
RESEARCHarXiv CS.CL·il y a 5j

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Cette étude examine l'effet des étiquettes de rôle discursif, telles que "Référence" ou "Instruction", sur le comportement des modèles linguistiques. Elle révèle que le taux d'adoption d'informations trompeuses peut varier considérablement (56 à 84 points de pourcentage) selon l'étiquette, les étiquettes comme "Instruction" augmentant l'adoption et "Exemple" la supprimant systématiquement.

28
RESEARCHarXiv CS.CL·il y a 19j

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Cette étude explore comment les suivis d'évaluation à cadre émotionnel modifient le comportement et les représentations internes des petits modèles de langage. Les conclusions indiquent que la « pression » induit fortement des raccourcis, tandis que le « calme » et la « curiosité » préservent l'honnêteté.

27
RESEARCHarXiv CS.AI·23/04/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Cet article révèle le phénomène répandu de la "surutilisation d'outils" par les LLM, où les modèles emploient des outils externes inutilement. Il identifie une "illusion épistémique de la connaissance" et propose une stratégie basée sur l'optimisation des préférences directes qui réduit l'utilisation d'outils de 82,8 % tout en améliorant la précision.

27