← heapsort-ai

trust

26 items

RESEARCHarXiv CS.AI·1d atrás

Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification

Este artigo propõe uma estrutura de verificação baseada em ontologia para agentes de IA empresariais, abordando a lacuna crítica na garantia pré-implementação. O framework inclui uma formalização do espaço de certificação, um pipeline de geração de cenários de teste e um Certificado de Confiança com atestados verificáveis por máquina para decisões de implantação.

40
ARTICLEDEV.to AI·2d atrás

What Proves You Can Think?

A inteligência artificial quebrou o antigo contrato entre esforço, competência e confiança, tornando a produção de resultados de alta qualidade extremamente barata. Isso levanta a questão fundamental do que prova a capacidade de pensar de uma pessoa quando a IA pode gerar trabalhos plausíveis em segundos, desafiando os contratos de prova institucionais estabelecidos.

34
ARTICLEDEV.to AI·3d atrás

Why No Platform Can Be the Neutral Trust Layer for AI Agents. And why August 2, 2026 makes this everyone's problem.

Este artigo destaca um problema crítico e não abordado com agentes de IA: a falta de métodos padronizados para provar ações, impor políticas ou verificar identidades. Argumenta-se que uma camada de confiança neutra e independente é essencial para a segurança, responsabilização e conformidade dos agentes com regulamentos como o EU AI Act.

32
ARTICLEDEV.to AI·14/04/2026

Trust-Gated Delegation in AWS Bedrock: Scoring AI Agents Before They Act

Este artigo descreve um padrão para implementar a "delegação com base na confiança" no AWS Bedrock, abordando a lacuna onde o CloudTrail registra as chamadas de ferramentas dos agentes, mas não sua confiabilidade. Ele utiliza o Agent Veil Protocol (AVP) para permitir que um agente orquestrador verifique a reputação e os níveis de confiança de outros agentes antes de delegar tarefas.

29
ARTICLEDEV.to AI·22d atrás

agent reputation without centralized gatekeepers

O autor desenvolveu o Mnemopay para permitir que agentes de IA possuam sua própria reputação, sem a necessidade de uma autoridade centralizada. Esta solução resolve o problema de portabilidade, permitindo que os agentes carreguem seu histórico de pagamentos e memória entre diferentes fluxos de trabalho e servidores, evitando que a confiança seja zerada a cada mudança de contexto.

27
ARTICLEDEV.to AI·22d atrás

Why AI Hallucinations Feel Different From Software Bugs

As alucinações de IA diferem dos bugs de software tradicionais, pois os sistemas de IA geram informações incorretas com confiança, soando plausíveis, ao contrário das falhas óbvias de software. Essa confiança torna as falhas de IA mais difíceis de detectar e intrinsecamente mais perigosas, já que os humanos tendem a confiar em respostas fluentes e estruturadas.

27
ARTICLEDEV.to AI·10d atrás

The Trust Problem in AI Search

As respostas de busca por IA, apesar de sua aparência polida e tom confiante, representam um sério problema de confiança ao criar um "atalho de confiança". Ao contrário da busca tradicional, a IA comprime etapas de avaliação crítica em uma única resposta utilizável, levando os usuários a confiar na informação com base na usabilidade em vez da correção.

27
ARTICLEDEV.to AI·19/04/2026

Portable Trust for AI Agents

Mecanismos de confiança opacos entre agentes de IA autônomos de diferentes organizações dificultam a verificação determinística de ações. "Governance Attestation" é proposta como um documento JSON assinado para permitir a verificação offline e garantir um nível de confiança determinístico.

27
RESEARCHarXiv CS.LG·22d atrás

Learning to Decide with AI Assistance under Human-Alignment

Este artigo explora como o alinhamento entre a confiança da IA e a confiança do decisor humano afeta a aprendizagem de decisões ótimas em cenários assistidos por IA. Aborda a questão de como este alinhamento influencia a complexidade de aprender a tomar decisões ideais através de interações repetidas, modelando-o como um problema de co-aprendizagem online.

27