embodied AI

8 items

ARTICLE↑ trendingReddit r/MachineLearning·25/04/2026

How Visual-Language-Action (VLA) Models Work [D]

Este artigo oferece uma análise técnica aprofundada de como os modelos Visual-Language-Action (VLA) funcionam, detalhando sua capacidade de mapear entradas de visão e linguagem em ações robóticas. Ele explora as principais abordagens de decodificação de ações, como ações autorregressivas tokenizadas, cabeças de ação baseadas em difusão e políticas de correspondência de fluxo.

machine learning embodied AI VLA models robotics

How Visual-Language-Action (VLA) Models Work [D]

DOCDEV.to AI·24/04/2026

How To Contribute to Open Source Embodied AI

Este conteúdo explora a ascensão da IA encarnada de código aberto, que democratiza o desenvolvimento de robôs inteligentes que interagem com o mundo físico. Ele oferece dicas chave para contribuir, como engajar-se com plataformas (ROS, Gazebo), desenvolver habilidades (programação, IA/ML) e participar ativamente em projetos.

Open Source embodied AI robotics AI development

RESEARCHarXiv CS.AI·6d atrás

AURA: Action-Gated Memory for Robot Policies at Constant VRAM

O artigo apresenta AURA-Mem, uma nova arquitetura de memória recorrente para robôs que mantém um tamanho constante de VRAM. Diferente do KV-cache, AURA-Mem utiliza um portão aprendido que escreve apenas quando a observação atual altera a próxima ação, sendo mais adequada para agentes embarcados com hardware limitado.

robot policies VRAM embodied AI robotics

NEWSDEV.to AI·8d atrás

MiniMax Claims 26% BU Bench Gain, Details Scarce

A startup chinesa MiniMax afirmou ter alcançado uma melhoria de 26% no BU Bench, um benchmark de planejamento de tarefas de IA incorporada. No entanto, a empresa não divulgou detalhes, dados ou metodologia, tornando a alegação inverificável.

AI claims Benchmarking embodied AI AI

RESEARCHarXiv CS.AI·09/05/2026

PRISM: Perception Reasoning Interleaved for Sequential Decision Making

PRISM é uma nova estrutura que integra percepção (VLM) e decisão (LLM) através de um pipeline dinâmico de perguntas e respostas, permitindo que o LLM refine ativamente a saída do VLM para uma compreensão da cena orientada por tarefas. Essa abordagem supera significativamente os modelos baseados em imagem existentes em benchmarks como ALFWorld e Room-to-Room.

VLM embodied AI AI robotics

RESEARCHarXiv CS.LG·11d atrás

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Esta pesquisa explora como modelos de mundo aprendem representações semânticas a partir da exploração física sem entrada linguística. Descobre-se que o espaço latente desenvolve estruturas semânticas espaciais que espelham a geometria física, com o alinhamento semântico melhorando junto com o desempenho da previsão.

machine learning World Models embodied AI representation learning

RESEARCHarXiv CS.AI·8d atrás

Physically Viable World Models: A Case for Query-Conditioned Embodied AI

Modelos de mundo para IA incorporada devem ser fisicamente viáveis, representando a estrutura física que governa os resultados das ações em vez de apenas prever observações futuras. Este trabalho expõe que modelos preditivos de observação existentes podem produzir simulações visualmente plausíveis, mas fisicamente erradas, e defende que a IA incorporada requer modelos de mundo que identifiquem a abstração física mais simples para responder a consultas de intervenção.

World Models Physics-based AI embodied AI robotics

ARTICLEDEV.to AI·16/04/2026

Prof. Alois Knoll im Interview: Ohne Körper keine echte KI

O Prof. Alois Knoll, pesquisador de robótica e IA, argumenta que a verdadeira inteligência requer um corpo, pois grandes modelos de linguagem estão presos ao espaço digital e carecem de experiência física. Ele enfatiza a necessidade de robôs humanoides para coletar dados no mundo real, fornecendo um nível de compreensão que a análise de texto pura não pode substituir.

humanoid robots embodied AI AI large language models