← heapsort-ai

robotics

68 items

RESEARCHarXiv CS.LG·il y a 8j

From Demonstrations to Rewards: Test-Time Prompt Optimization for VLM Reward Models

Des chercheurs proposent Demo2Reward, une technique d'adaptation en temps de test pour optimiser les modèles de récompense de Vision-Langage (VLMs) en robotique. Elle utilise quelques démonstrations pour réduire les faux positifs tout en préservant les vrais positifs, sans nécessiter d'entraînement supplémentaire du modèle.

27
RESEARCHarXiv CS.LG·il y a 29j

Distributional Reinforcement Learning via the Cram\'er Distance

Cet article présente l'algorithme C-DSAC, qui applique Soft Actor-Critic dans un cadre d'apprentissage par renforcement distributionnel en minimisant la distance de Cramér. Les résultats empiriques montrent que C-DSAC surpasse les méthodes existantes, en particulier dans les environnements de haute complexité, grâce à des mises à jour des valeurs Q basées sur la confiance.

27
RESEARCHarXiv CS.LG·il y a 27j

Learning When to Act: Communication-Efficient Reinforcement Learning via Run-Time Assurance

Cet article présente une approche d'apprentissage par renforcement économe en communication, où une seule politique apprend à la fois les entrées de commande et les décisions de synchronisation, protégée par un bouclier de sécurité Lyapunov ponctuel. Une couche d'assurance d'exécution annule la politique pour fournir des garanties de sécurité plus strictes et obtenir des intervalles inter-échantillons moyens nettement plus élevés sur divers systèmes.

27
RESEARCHarXiv CS.AI·il y a 12j

Ultra-Reduced-Impact-Encased-Logging (URIEL): propose a new method for selective sustainable logging and post-harvest silvicultural treatment in tropical forest using airborne robotics systems

Cet article propose une nouvelle méthode d'exploitation forestière, URIEL, pour les forêts tropicales, combinant des techniques d'héli-abattage avec l'utilisation intensive de la robotique et de l'IA, intégrées à des traitements sylvicoles post-récolte effectués par des drones. L'étude démontre la viabilité économique élevée d'URIEL et sa capacité à éliminer pratiquement les dommages collatéraux aux forêts tout en maintenant les services écosystémiques.

27
RESEARCHarXiv CS.AI·il y a 9j

Physically Viable World Models: A Case for Query-Conditioned Embodied AI

Les modèles du monde pour l'IA incarnée doivent être physiquement viables, représentant la structure physique qui gouverne les résultats des actions plutôt que de simplement prédire des observations futures. Cet article expose que les modèles prédictifs d'observation existants peuvent produire des déroulements visuellement plausibles mais physiquement erronés, et soutient que l'IA incarnée nécessite des modèles du monde qui identifient l'abstraction physique la plus simple pour répondre aux requêtes d'intervention.

27
ARTICLEDEV.to AI·16/04/2026

Prof. Alois Knoll im Interview: Ohne Körper keine echte KI

Le professeur Alois Knoll, chercheur en robotique et IA, affirme que la véritable intelligence nécessite un corps, car les grands modèles de langage sont confinés à l'espace numérique et manquent d'expérience physique. Il souligne l'importance des robots humanoïdes pour collecter des données dans le monde réel, offrant un niveau de compréhension que l'analyse textuelle pure ne peut remplacer.

27
ARTICLEDEV.to AI·24/04/2026

Why I built a Zero-Trust Proxy for my AI-controlled Robot 为什么我要为我的 AI 控制机器人构建零信任代理

L'auteur a développé HAL-Proxy, une passerelle de couche d'abstraction matérielle "zero-trust" en Go, pour atténuer les risques d'hallucinations de l'IA dans les robots physiques. Il souligne la différence cruciale entre les défaillances de l'IA dans les logiciels et le matériel, où les erreurs peuvent entraîner des dommages physiques.

27
RESEARCHarXiv CS.AI·30/04/2026

Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields

Le framework Distill-Belief résout le défi de la localisation et de la caractérisation inverse de sources (ISLC) pour les agents mobiles, en équilibrant correction et efficacité. Il propose un modèle enseignant-étudiant où un filtre particulaire bayésien correct guide un étudiant compact pour des décisions rapides et conscientes de l'incertitude en temps réel.

27
RESEARCHHugging Face Blog·05/03/2026

Bringing Robotics AI to Embedded Platforms: Dataset Recording, VLA Fine‑Tuning, and On‑Device Optimizations

Este conteúdo provavelmente explora a implantação de inteligência artificial em robótica para plataformas embarcadas. Abrange metodologias para gravação de conjuntos de dados, ajuste fino de modelos VLA e otimizações necessárias para execução eficiente em dispositivos com recursos limitados.

27
ARTICLEDEV.to AI·05/05/2026

Meta Acquires Assured Robot Intelligence: An In-De…

Meta a acquis Assured Robot Intelligence pour améliorer considérablement ses modèles d'IA humanoïde, une démarche stratégique qui reflète un effort pour intégrer des capacités robotiques avancées. Cette acquisition positionne Meta à l'avant-garde de l'innovation en automatisation, pouvant révolutionner les industries dépendantes de la robotique.

23
ARTICLEMIT Tech Review AI·17/04/2026

How robots learn: A brief, contemporary history

Cet article explore l'histoire contemporaine de la robotique, en contrastant les rêves ambitieux de créer des robots complexes et humanoïdes avec la réalité pratique du développement de machines plus spécialisées. Il met en lumière la quête continue des chercheurs pour concrétiser les robots avancés et intelligents souvent imaginés dans la science-fiction.

22
ARTICLEMIT Tech Review AI·21/04/2026

World models

Alors que les systèmes d'IA maîtrisent le monde numérique, le domaine physique reste un défi majeur pour l'humanité. Des tâches comme plier le linge ou naviguer en ville s'avèrent plus difficiles pour l'IA que de composer des romans ou de coder des applications.

21
ARTICLEMIT Tech Review AI·21/04/2026

Humanoid data

Le texte décrit des invitations à des applications payant en cryptomonnaie pour filmer des tâches quotidiennes ou contrôler à distance un bras robotique en Chine pour résoudre des puzzles. Ces scénarios illustrent des méthodes de collecte de données et d'interaction avec des systèmes d'IA/robotique.

21