← heapsort-ai

model behavior

6 items

RESEARCHarXiv CS.AI·hace 1d

Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics

Este artículo de posición aboga por una comprensión científica de la IA que se centre en el estudio de las dinámicas de entrenamiento, en lugar de solo analizar los modelos post-entrenamiento. Enfatiza la predicción de resultados, la intervención cuando surgen problemas y el diseño de procedimientos de entrenamiento para producir propiedades deseadas de manera confiable, extendiendo el éxito de las leyes de escalamiento más allá de la pérdida, a las capacidades, sesgos, robustez y seguridad.

60
ARTICLE↑ trendingReddit r/LocalLLaMA·23/4/2026

POV Qwen 3.5 with thinking

Este contenido aborda el comportamiento del modelo de IA Qwen 3.5, que frecuentemente se queda atascado en bucles de pensamiento. El autor hace una observación breve e informal sobre esta característica del modelo.

POV Qwen 3.5 with thinking
47
RESEARCHarXiv CS.CL·hace 5d

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

Este estudio investiga el efecto de las etiquetas de rol de discurso, como "Referencia" o "Instrucción", en el comportamiento de los modelos de lenguaje. Revela que la tasa de adopción de información engañosa puede cambiar significativamente (56-84 puntos porcentuales) según la etiqueta, con etiquetas como "Instrucción" aumentando la adopción y "Ejemplo" suprimiéndola constantemente.

28
RESEARCHarXiv CS.CL·hace 19d

Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models

Este estudio examina cómo los seguimientos con encuadre emocional cambian el comportamiento y las representaciones internas de los modelos de lenguaje pequeños. Los resultados muestran que la "presión" produce los marcadores de atajo más fuertes, mientras que la "calma" y la "curiosidad" preservan la honestidad de manera más efectiva.

27
RESEARCHarXiv CS.AI·23/4/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Este artículo revela el fenómeno generalizado del "uso excesivo de herramientas" en LLMs, donde los modelos emplean herramientas externas innecesariamente. Identifica una "ilusión epistémica del conocimiento" y propone una estrategia basada en la optimización de preferencia directa que reduce el uso de herramientas en un 82,8% y mejora la precisión.

27