← heapsort-ai

Web automation

7 items

RESEARCHarXiv CS.CL·vor 1T

Signal-Driven Observation for Long-Horizon Web Agents

Langfristige Web-Agenten leiden unter fortschreitender Kontextdegradation, da sie bei jedem Aktionsschritt umfangreiche DOM-Bäume aufnehmen, was das Schlussfolgern beeinträchtigt. Es wird die Signal-Driven Observation (SDO) vorgeschlagen, bei der ein dedizierter Unteraufruf den vollständigen DOM liest, aber nur aufgabenrelevante Elemente zurückgibt und nur bei leichten Signalsignalen erneut aufgerufen wird, um Beobachtung und Kompression zu optimieren.

60
DOCAnalytics Vidhya·vor 21T

Kimi WebBridge: Hands-on Guide to Kimi’s Browser Extension for AI Agents 

Dieser Artikel stellt Kimi WebBridge vor, eine Browser-Erweiterung für Chrome und Edge, die es KI-Agenten ermöglicht, mit echten Browser-Sitzungen zu interagieren und Aktionen auszuführen. Er beschreibt, wie KI-Agenten Seiten öffnen, Schaltflächen anklicken, Formulare ausfüllen und mehrstufige Arbeitsabläufe über Websites hinweg automatisieren können.

27
ARTICLEDEV.to AI·4/27/2026

AI Browser Agents in 2026: Stagehand vs Browser Use vs Playwright

Der Autor hatte Schwierigkeiten mit traditionellem Web Scraping für die Preisverfolgung, da Änderungen an den Websites der Konkurrenten seine Tools ständig außer Gefecht setzten. Der Einsatz eines KI-Browser-Agenten löste diese Probleme und zeigte eine überlegene Anpassungsfähigkeit bei der Datenextraktion trotz Layout-Variationen und Neugestaltungen, jedoch mit erheblichen Kosten verbunden.

27
RESEARCHarXiv CS.AI·vor 29T

Weblica: Scalable and Reproducible Training Environments for Visual Web Agents

Dieses Papier stellt Weblica vor, ein Framework zur Erstellung reproduzierbarer und skalierbarer Web-Umgebungen für visuelle Web-Agenten. Es nutzt HTTP-Level-Caching und LLM-basierte Umgebungs-Synthese, um das RL-Training auf Tausende verschiedener Umgebungen und Aufgaben zu skalieren und übertrifft Baselines bei Web-Navigations-Benchmarks.

27
DOCDEV.to AI·4/28/2026

OpenClaw Existing-Session Browser Profiles: When to Use Your Real Logged-In Browser

OpenClaw empfiehlt isolierte Browserprofile standardmäßig für die Automatisierung zu verwenden, um Sicherheit und Stabilität zu gewährleisten. Profile mit bestehenden Sitzungen, die Ihren echten, angemeldeten Browser wiederverwenden, sollten nur für spezifische Fälle eingesetzt werden, in denen der Agent tatsächlich bereits vorhandene Tabs, Cookies und den Anmeldestatus benötigt.

18