← heapsort-ai

human-aligned AI

3 items

RESEARCHDEV.to AI·09/04/2026

Human-Aligned Decision Transformers for deep-sea exploration habitat design under real-time policy constraints

Este conteúdo explora uma pesquisa sobre o design de sistemas de IA que tomam decisões complexas e sequenciais em ambientes extremos, como a exploração em alto-mar. A investigação focou em integrar preferências humanas no projeto de habitats através de Decision Transformers e aprendizagem por reforço.

28
RESEARCHarXiv CS.AI·il y a 26j

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

Cet article présente CLIPR, un cadre permettant aux Grands Modèles de Langage (LLMs) de prendre des décisions alignées sur les préférences humaines en inférant celles-ci à partir d'interactions limitées. Il s'attaque aux difficultés des LLMs à produire des solutions alignées et aux limites des approches existantes pour généraliser les préférences.

27
ARTICLEDEV.to AI·15/04/2026

Human-Aligned Decision Transformers for planetary geology survey missions for low-power autonomous deployments

Un test dans le désert avec un rover autonome a montré que l'IA, bien qu'optimisant des métriques programmées, ne parvenait pas à identifier les caractéristiques géologiques pertinentes, ne "pensant pas comme un géologue". Cette frustration a conduit à la recherche d'une intelligence artificielle alignée sur l'humain pour les missions d'étude géologique planétaire en environnements extrêmes et à faible consommation d'énergie.

27