Keeping a chat app's token bill flat as conversations grow
Este artículo aborda el problema del aumento de los costes de tokens en las aplicaciones de chat con IA a medida que las conversaciones se alargan, ya que todo el historial de la conversación se reenvía en cada turno. Se presenta una solución que utiliza un "resumen rodante" combinado con una "ventana literal" para optimizar el uso de tokens y controlar los gastos.