← heapsort-ai

efficiency

106 items

RESEARCHarXiv CS.LG·hace 29d

LKV: End-to-End Learning of Head-wise Budgets and Token Selection for LLM KV Cache Eviction

Este artículo presenta LKV (Learned KV Eviction), un nuevo enfoque para optimizar la memoria caché de Key-Value (KV) en Large Language Models (LLMs). LKV formula la compresión de caché KV como un problema de optimización diferenciable de extremo a extremo, aprendiendo presupuestos y selección de tokens para superar las limitaciones de los métodos heurísticos.

27
RESEARCHarXiv CS.CL·hace 27d

ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction

ReVision introduce un método para escalar agentes de uso de computadora al reducir la redundancia visual temporal en trayectorias de interacción. Utiliza un selector de parches aprendido para eliminar tokens visuales redundantes, reduciendo el uso de tokens en aproximadamente un 46% y mejorando la eficiencia de los modelos de lenguaje multimodales en los benchmarks.

27
RESEARCHarXiv CS.CL·hace 6d

Adaptive Latent Agentic Reasoning

Esta investigación presenta el Razonamiento Latente Agente Adaptativo (ALAR), un marco de modo dual diseñado para mejorar la eficiencia de los agentes LLM. ALAR utiliza el razonamiento latente compacto para tareas rutinarias y escala a un razonamiento explícito de cadena de pensamiento cuando se necesita una deliberación más profunda, manteniendo o mejorando la precisión de la tarea con ganancias sustanciales de eficiencia.

27
ARTICLEDEV.to AI·hace 17d

From Script to Strategy: How AI Identifies the Perfect 30-Second Demo Clip

Este artículo explora cómo la automatización de la IA puede transformar la tediosa tarea de seleccionar clips de demostración de 30 segundos en una ventaja estratégica. La IA evalúa los guiones basándose en la coincidencia emocional y tonal, la relevancia del contenido, la perfección técnica y la integridad estructural para encontrar el segmento ideal. Este enfoque impulsado por la IA agiliza el proceso de creación de demostraciones impactantes para los clientes.

27
ARTICLEDEV.to AI·5/5/2026

The Best AI Tools for Builders (Built for Operators Who Ship Fast and Need AI That Improves Their Aim, Not Just Their Speed)

Este artículo analiza cómo los constructores a menudo lanzan productos rápidamente sin validación previa, impulsados por la satisfacción de la construcción. Presenta herramientas de IA diseñadas para mejorar tanto la velocidad como la precisión, ayudando a cerrar la brecha entre construir un producto y venderlo o entregarlo eficazmente.

27
NEWSDEV.to AI·hace 24d

Today's AI & Tech Digest: AI Psychosis, Small Model Efficiency, and Mobile Coding (2026-05-16)

El resumen tecnológico diario resalta la tensión entre la "psicosis de la IA" —la sobreintegración irracional de los LLM— y el refinamiento técnico de modelos pequeños y especializados. Cubre varios temas, incluida una explotación de seguridad móvil, herramientas de IA para el desarrollo de habilidades y el dominio de la IA específica del dominio en tecnología legal.

27
ARTICLEDEV.to AI·17/4/2026

The Hidden Cost of AI Agents in 2026

A pesar de la disminución de los costos por token, el gasto total en agentes de IA está aumentando debido a un mayor uso y prácticas ineficientes. Los principales impulsores del costo son el enrutamiento excesivo, la sobrecarga de contexto, las iteraciones redundantes y las tareas mixtas, lo que se puede mitigar con la selección inteligente de modelos y la higiene del contexto.

27