← heapsort-ai

Context window

22 items

ARTICLE↑ trendingReddit r/MachineLearning·4/12/2026

KIV: 1M token context window on a RTX 4070 (12GB VRAM), no retraining, drop-in HuggingFace cache replacement - Works with any model that uses DynamicCache [P]

KIV (K-Indexed V Materialization) is a middleware layer that replaces the standard HuggingFace KV cache with a tiered retrieval system, moving old data to system RAM. This enables 1M token context windows on an RTX 4070 (12GB VRAM) with only 12MB VRAM overhead and good performance.

42
ARTICLEDEV.to AI·4/11/2026

The Context Window Trap: Why More AI Context is Costing You More Money

O autor relata sua descoberta de que fornecer contexto excessivo aos modelos de IA, como Claude e GPT-4, para desenvolvimento de software, na verdade aumentava os custos em vez de melhorar a eficiência. Ao usar sua ferramenta TokenBar para monitorar o uso de tokens, ele percebeu que "dumps" de contexto massivos, de 8.000-12.000 tokens, eram ineficientes e caros.

29
ARTICLEDEV.to AI·4/21/2026

How we handle LLM context window limits without losing conversation quality

This article addresses the critical challenge of LLM context window limits, which causes chatbots to forget information and agents to lose track of goals, despite models offering larger windows. It highlights that simply expanding context windows is insufficient due to prohibitive costs and increased latency, promising to share production strategies and trade-offs.

29
CASEDEV.to AI·4/10/2026

My AI pipeline had a 1M token context window. The output still got worse.

Um pipeline de investigação AIOps, que utilizava uma janela de contexto de 1M tokens com Gemini, viu sua qualidade de saída piorar devido à má seleção de contexto. A proporção fixa de carregamento de código irrelevante, especialmente de um repositório legado, estava degradando o desempenho do modelo, evidenciando que a qualidade do contexto é mais importante que a quantidade.

27
NEWSDEV.to AI·12d ago

2026-05-28 Token Ledger Digest

The May 28, 2026 Token Ledger Digest highlights changes in AI models, including a price reduction for Tencent's Hy3 preview and the release of MoonshotAI's new free Kimi K2.6 model. Additionally, Baidu Qianfan's free CoBuddy model was removed from the catalog.

27
ARTICLEDEV.to AI·8d ago

LLM, Model, Token, Context Window

This content explains Large Language Models (LLMs) as vast neural networks trained on immense datasets, contrasting their predictive token generation with traditional database queries. It outlines the AI system architecture as a client-server model, connecting chat interfaces, context windows, and the LLM itself.

27
ARTICLEDEV.to AI·4/9/2026

Claude Code Forgot My Code. Here's Why.

O artigo explica por que o Claude Code "esquece" o código do usuário: a janela de contexto finita é preenchida por saídas extensas de comandos CLI (como npm install), comprimindo ou descartando o código real. Isso mostra como o "ruído" do terminal pode consumir rapidamente a capacidade de contexto de uma IA.

26