← heapsort-ai

Token usage

16 items

ARTICLE↑ trendingReddit r/MachineLearning·5/5/2026

Production AI very different from the demos [D]

Una función de IA en producción generó costos inesperadamente altos debido a indicaciones más largas de los clientes y a la recuperación de contexto adicional, duplicando el uso de tokens. La falta de herramientas de atribución de costos en el panel de OpenAI dificulta el seguimiento de qué función o modelo está generando los gastos.

42
ARTICLEDEV.to AI·15/4/2026

Why I Built TokenBar: AI Costs Are a Live Problem, Not a Monthly Report

El autor construyó TokenBar para abordar el problema de los costos invisibles de la IA, dándose cuenta de que solo verificaba el gasto después de que el daño ya estaba hecho. La herramienta ofrece monitoreo en tiempo real del uso y costo de la IA directamente en la barra de menú, convirtiendo los costos en una señal en vivo para el flujo de trabajo.

28
RESEARCHarXiv CS.AI·hace 5d

What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

Este artículo analiza las estrategias de comunicación entre agentes en sistemas multiagente basados en LLMs, descubriendo que el lenguaje natural sin restricciones puede inflar el uso de tokens y afectar el rendimiento. Propone PACT (Protocolized Action-state Communication and Transmission), un método para optimizar la comunicación proyectando las salidas de los agentes en registros de estado-acción compactos.

28
ARTICLEDEV.to AI·hace 6d

Tokenmaxxing Is a 2026 Anti-Pattern: Why Your Team's Token Bill Is Up 10x and What

El artículo describe el "tokenmaxxing", un antipatrón donde las pilas de agentes de IA provocan un aumento significativo en el consumo de tokens y los costos asociados, a pesar de la caída en los precios por token. Este aumento en las facturas afecta incluso a equipos pequeños debido a más llamadas a modelos, reintentos, pasos de "pensamiento" y contexto.

27
ARTICLEDEV.to AI·15/4/2026

The day I realized AI costs need a warning light

Un desarrollador individual se enfrentó a facturas inesperadas de IA debido al coste acumulativo de prompts pequeños y frecuentes sin seguimiento en tiempo real. Para abordar esta "muerte por mil pequeñas indicaciones", creó TokenBar, una aplicación de barra de menú que proporciona visibilidad inmediata del uso y los costes de tokens de IA, pasando del análisis post-mortem a la gestión proactiva.

27
ARTICLEDEV.to AI·hace 17d

MCPs Are Eating Your Context Window (And What To Do About It)

Este artículo analiza cómo los servidores del Protocolo de Contexto del Modelo (MCP) consumen la ventana de contexto de los modelos de IA al cargar de antemano esquemas de herramientas, lo que genera un alto uso de tokens. Propone que las "habilidades" pueden resolver este problema cargando las herramientas de forma perezosa, optimizando así el costo y la eficiencia.

27
ARTICLEDEV.to AI·15/4/2026

I Stopped Treating AI Spend Like a Monthly Bill

El autor se dio cuenta de que tratar el gasto en IA como una factura mensual era ineficaz, ya que los costos aumentaban por falta de atención en el uso. Para solucionarlo, creó TokenBar, una aplicación que muestra el uso de tokens en tiempo real, con el objetivo de cambiar el comportamiento y resolver problemas de atención en el gasto en IA.

22
ARTICLEDEV.to AI·15/4/2026

Why I Built TokenBar After One Ugly AI Bill

El autor creó TokenBar, una aplicación para la barra de menú de macOS, para abordar el problema de los costos impredecibles del uso de IA de servicios como Claude y ChatGPT. Esta herramienta proporciona el uso de tokens y el costo en tiempo real, permitiendo a los usuarios gestionar proactivamente su gasto en IA y trabajar de manera más eficiente al hacer visibles los costos.

21