← heapsort-ai

Context window

22 items

ARTICLE↑ trendingReddit r/MachineLearning·12/4/2026

KIV: 1M token context window on a RTX 4070 (12GB VRAM), no retraining, drop-in HuggingFace cache replacement - Works with any model that uses DynamicCache [P]

KIV (K-Indexed V Materialization) es una capa de middleware que reemplaza la caché KV estándar de HuggingFace con un sistema de recuperación por niveles, moviendo datos antiguos a la RAM del sistema. Esto permite ventanas de contexto de 1 millón de tokens en una RTX 4070 (12GB VRAM) con solo 12MB de sobrecarga de VRAM y buen rendimiento.

42
ARTICLEDEV.to AI·11/4/2026

The Context Window Trap: Why More AI Context is Costing You More Money

O autor relata sua descoberta de que fornecer contexto excessivo aos modelos de IA, como Claude e GPT-4, para desenvolvimento de software, na verdade aumentava os custos em vez de melhorar a eficiência. Ao usar sua ferramenta TokenBar para monitorar o uso de tokens, ele percebeu que "dumps" de contexto massivos, de 8.000-12.000 tokens, eram ineficientes e caros.

29
ARTICLEDEV.to AI·21/4/2026

How we handle LLM context window limits without losing conversation quality

Este artículo aborda el desafío crítico de los límites de la ventana de contexto de los LLM, lo que provoca que los chatbots olviden información y los agentes pierdan el rumbo, a pesar de que los modelos ofrecen ventanas más grandes. Destaca que simplemente expandir las ventanas de contexto es insuficiente debido a costos prohibitivos y mayor latencia, prometiendo compartir estrategias de producción y sus compensaciones.

29
ARTICLEDEV.to AI·hace 6d

The Harness Has a Token Budget

El proyecto CLAUDE.md excedió su presupuesto de tokens, lo que provocó que el agente de IA comenzara a ignorar reglas importantes debido a la sobrecarga de contexto. La conclusión es que el "harness" tiene un presupuesto de tokens, y cada línea adicional afecta la capacidad del agente para procesar información específica de la tarea.

28
CASEDEV.to AI·10/4/2026

My AI pipeline had a 1M token context window. The output still got worse.

Um pipeline de investigação AIOps, que utilizava uma janela de contexto de 1M tokens com Gemini, viu sua qualidade de saída piorar devido à má seleção de contexto. A proporção fixa de carregamento de código irrelevante, especialmente de um repositório legado, estava degradando o desempenho do modelo, evidenciando que a qualidade do contexto é mais importante que a quantidade.

27
NEWSDEV.to AI·hace 12d

2026-05-28 Token Ledger Digest

El Token Ledger Digest del 28 de mayo de 2026 destaca cambios en los modelos de IA, incluyendo la reducción de precio para la vista previa de Tencent Hy3 y el lanzamiento de un nuevo modelo gratuito Kimi K2.6 de MoonshotAI. Además, el modelo gratuito CoBuddy de Baidu Qianfan fue eliminado del catálogo.

27
ARTICLEDEV.to AI·hace 8d

LLM, Model, Token, Context Window

Este contenido explica los Large Language Models (LLM) como vastas redes neuronales entrenadas con inmensos conjuntos de datos, contrastando su generación predictiva de tokens con las consultas a bases de datos tradicionales. Describe la arquitectura del sistema de IA como un modelo cliente-servidor, conectando interfaces de chat, ventanas de contexto y el propio LLM.

27
ARTICLEDEV.to AI·15/4/2026

GPT-6 just merged ChatGPT, Codex, and a browser into one agent.

El nuevo GPT-6 de OpenAI unifica funciones de chat, generación de código y navegación web en un solo agente, aprovechando un modelo base potente y una arquitectura de razonamiento de dos niveles. Este modelo cuenta con una ventana de contexto real y utilizable de 2M tokens, mejorando significativamente su utilidad para tareas complejas como la telemetría de IoT.

27
ARTICLEDEV.to AI·9/4/2026

Claude Code Forgot My Code. Here's Why.

O artigo explica por que o Claude Code "esquece" o código do usuário: a janela de contexto finita é preenchida por saídas extensas de comandos CLI (como npm install), comprimindo ou descartando o código real. Isso mostra como o "ruído" do terminal pode consumir rapidamente a capacidade de contexto de uma IA.

26