← heapsort-ai

multimodal models

2 items

RESEARCHarXiv CS.AI·5/1/2026

Step-level Optimization for Efficient Computer-use Agents

Diese Forschung beleuchtet die Ineffizienz aktueller Computer-Nutzungs-Agenten, die große multimodale Modelle für jede GUI-Interaktion überbeanspruchen. Es wird argumentiert, dass Aufgaben heterogen sind, wobei Routineschritte weniger Rechenleistung benötigen und Fehler sich in Hochrisikomomenten wie Stillstand oder semantischer Drift konzentrieren, was eine gezielte Optimierung erfordert.

27
RESEARCHarXiv CS.AI·vor 29T

Auto-Rubric as Reward: From Implicit Preferences to Explicit Multimodal Generative Criteria

Diese Forschungsarbeit stellt Auto-Rubric as Reward (ARR) vor, ein neuartiges Framework zur Ausrichtung multimodaler generativer Modelle an menschlichen Präferenzen. ARR externalisiert das implizite Präferenzwissen eines VLM in explizite, prompt-spezifische Rubriken, wodurch menschliches Urteilsvermögen in unabhängig überprüfbare Qualitätsdimensionen zerlegt wird, um Einschränkungen traditioneller RLHF-Ansätze zu überwinden.

27