← heapsort-ai

embodied AI

8 items

ARTICLE↑ trendingReddit r/MachineLearning·25/04/2026

How Visual-Language-Action (VLA) Models Work [D]

Este artigo oferece uma análise técnica aprofundada de como os modelos Visual-Language-Action (VLA) funcionam, detalhando sua capacidade de mapear entradas de visão e linguagem em ações robóticas. Ele explora as principais abordagens de decodificação de ações, como ações autorregressivas tokenizadas, cabeças de ação baseadas em difusão e políticas de correspondência de fluxo.

How Visual-Language-Action (VLA) Models Work [D]
42
DOCDEV.to AI·24/04/2026

How To Contribute to Open Source Embodied AI

Este conteúdo explora a ascensão da IA encarnada de código aberto, que democratiza o desenvolvimento de robôs inteligentes que interagem com o mundo físico. Ele oferece dicas chave para contribuir, como engajar-se com plataformas (ROS, Gazebo), desenvolver habilidades (programação, IA/ML) e participar ativamente em projetos.

29
RESEARCHarXiv CS.AI·09/05/2026

PRISM: Perception Reasoning Interleaved for Sequential Decision Making

PRISM é uma nova estrutura que integra percepção (VLM) e decisão (LLM) através de um pipeline dinâmico de perguntas e respostas, permitindo que o LLM refine ativamente a saída do VLM para uma compreensão da cena orientada por tarefas. Essa abordagem supera significativamente os modelos baseados em imagem existentes em benchmarks como ALFWorld e Room-to-Room.

27
RESEARCHarXiv CS.LG·11d atrás

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Esta pesquisa explora como modelos de mundo aprendem representações semânticas a partir da exploração física sem entrada linguística. Descobre-se que o espaço latente desenvolve estruturas semânticas espaciais que espelham a geometria física, com o alinhamento semântico melhorando junto com o desempenho da previsão.

27
RESEARCHarXiv CS.AI·8d atrás

Physically Viable World Models: A Case for Query-Conditioned Embodied AI

Modelos de mundo para IA incorporada devem ser fisicamente viáveis, representando a estrutura física que governa os resultados das ações em vez de apenas prever observações futuras. Este trabalho expõe que modelos preditivos de observação existentes podem produzir simulações visualmente plausíveis, mas fisicamente erradas, e defende que a IA incorporada requer modelos de mundo que identifiquem a abstração física mais simples para responder a consultas de intervenção.

27
ARTICLEDEV.to AI·16/04/2026

Prof. Alois Knoll im Interview: Ohne Körper keine echte KI

O Prof. Alois Knoll, pesquisador de robótica e IA, argumenta que a verdadeira inteligência requer um corpo, pois grandes modelos de linguagem estão presos ao espaço digital e carecem de experiência física. Ele enfatiza a necessidade de robôs humanoides para coletar dados no mundo real, fornecendo um nível de compreensão que a análise de texto pura não pode substituir.

27