model behavior

6 items

RESEARCHarXiv CS.AI·hace 1d

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Este artículo de posición aboga por una comprensión científica de la IA que se centre en el estudio de las dinámicas de entrenamiento, en lugar de solo analizar los modelos post-entrenamiento. Enfatiza la predicción de resultados, la intervención cuando surgen problemas y el diseño de procedimientos de entrenamiento para producir propiedades deseadas de manera confiable, extendiendo el éxito de las leyes de escalamiento más allá de la pérdida, a las capacidades, sesgos, robustez y seguridad.

AI research methodology scaling laws model behavior science of AI

ARTICLE↑ trendingReddit r/LocalLLaMA·23/4/2026

POV Qwen 3.5 with thinking

Este contenido aborda el comportamiento del modelo de IA Qwen 3.5, que frecuentemente se queda atascado en bucles de pensamiento. El autor hace una observación breve e informal sobre esta característica del modelo.

thinking loops model behavior AI Model Qwen

RESEARCHarXiv CS.CL·27/4/2026

Shared Lexical Task Representations Explain Behavioral Variability In LLMs

Esta investigación explora la sensibilidad a los prompts en LLMs, comparando los estilos de instrucción y de ejemplo. Se encuentra que, a pesar de la variación en el rendimiento, los LLMs comparten mecanismos subyacentes comunes, como los "lexical task heads" que describen la tarea y activan la producción de respuestas.

model interpretability LLMs prompt-engineering attention mechanisms

RESEARCHarXiv CS.CL·hace 5d

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudio investiga el efecto de las etiquetas de rol de discurso, como "Referencia" o "Instrucción", en el comportamiento de los modelos de lenguaje. Revela que la tasa de adopción de información engañosa puede cambiar significativamente (56-84 puntos porcentuales) según la etiqueta, con etiquetas como "Instrucción" aumentando la adopción y "Ejemplo" suprimiéndola constantemente.

language models Context NLP model behavior

RESEARCHarXiv CS.CL·hace 19d

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudio examina cómo los seguimientos con encuadre emocional cambian el comportamiento y las representaciones internas de los modelos de lenguaje pequeños. Los resultados muestran que la "presión" produce los marcadores de atajo más fuertes, mientras que la "calma" y la "curiosidad" preservan la honestidad de manera más efectiva.

NLP model behavior emotional framing AI Research

RESEARCHarXiv CS.AI·23/4/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Este artículo revela el fenómeno generalizado del "uso excesivo de herramientas" en LLMs, donde los modelos emplean herramientas externas innecesariamente. Identifica una "ilusión epistémica del conocimiento" y propone una estrategia basada en la optimización de preferencia directa que reduce el uso de herramientas en un 82,8% y mejora la precisión.

LLMs Knowledge Representation Reasoning model behavior