← heapsort-ai

Web automation

7 items

RESEARCHarXiv CS.CL·hace 1d

Signal-Driven Observation for Long-Horizon Web Agents

Los agentes web de horizonte largo sufren una degradación progresiva del contexto al ingerir árboles DOM masivos en cada paso de acción, lo que erosiona el razonamiento. Se propone la Observación Dirigida por Señales (SDO), donde una subllamada dedicada lee el DOM completo pero devuelve solo elementos relevantes, reactivada por señales ligeras, para optimizar la observación y la compresión.

60
DOCAnalytics Vidhya·hace 21d

Kimi WebBridge: Hands-on Guide to Kimi’s Browser Extension for AI Agents 

Este artículo presenta Kimi WebBridge, una extensión de navegador para Chrome y Edge que permite a los agentes de IA interactuar y realizar acciones dentro de sesiones de navegador reales. Detalla cómo los agentes de IA pueden abrir páginas, hacer clic en botones, rellenar formularios y automatizar flujos de trabajo de varios pasos en sitios web.

27
ARTICLEDEV.to AI·27/4/2026

AI Browser Agents in 2026: Stagehand vs Browser Use vs Playwright

El autor experimentó dificultades con el web scraping tradicional para el seguimiento de precios, ya que los cambios en los sitios web de los competidores rompían constantemente sus herramientas. La adopción de un agente de navegador de IA resolvió estos problemas, demostrando una adaptabilidad superior en la extracción de datos, a pesar de las variaciones de diseño y los rediseños, pero con un costo significativo.

27
RESEARCHarXiv CS.AI·hace 29d

Weblica: Scalable and Reproducible Training Environments for Visual Web Agents

Este artículo propone Weblica, un framework para construir entornos web reproducibles y escalables para agentes web visuales. Utiliza el almacenamiento en caché a nivel HTTP y la síntesis de entornos basada en LLM para entrenar a agentes de RL en miles de tareas diversas, superando a los modelos base en los puntos de referencia de navegación web.

27
DOCDEV.to AI·28/4/2026

OpenClaw Existing-Session Browser Profiles: When to Use Your Real Logged-In Browser

OpenClaw aconseja usar perfiles de navegador aislados como predeterminados para la automatización, priorizando la seguridad y estabilidad. Los perfiles de sesión existente, que reutilizan su navegador real con sesión iniciada, deben reservarse para casos específicos donde el agente realmente necesite pestañas, cookies y estados de inicio de sesión preexistentes.

18