AI control

5 items

RESEARCHarXiv CS.AI·il y a 1j

Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety

Cet article examine la "sélection d'attaque" dans des contextes d'IA agentique, où les attaquants choisissent stratégiquement quand lancer et arrêter les attaques. Les résultats montrent que cette capacité réduit considérablement la sécurité empirique dans les évaluations de contrôle de l'IA, même avec des budgets d'audit limités.

security AI control Agentic AI adversarial attacks

ARTICLEDEV.to AI·23/04/2026

Simple and Controllable Music Generation

Le contenu aborde la création musicale de manière simple et contrôlable grâce à l'intelligence artificielle. Il présente une méthode permettant de générer des compositions musicales avec plus de facilité et de précision quant aux caractéristiques souhaitées.

Audio AI AI control music generation Generative AI

ARTICLEDEV.to AI·03/05/2026

The AI "Intelligence-Authority" Gap: Why Your Agents Need a Deterministic Handbrake

L'article aborde le "Fossé Intelligence-Autorité de l'IA", soulignant le besoin critique de mécanismes de contrôle déterministes, ou un "frein à main", pour les agents d'IA. Il souligne que si les agents d'IA gagnent en intelligence, ils nécessitent une surveillance humaine robuste pour prévenir les résultats imprévus.

human-in-the-loop AI control AI safety AI agents

ARTICLELangChain Blog·11/04/2026

Your harness, your memory

Les « agent harnesses » deviennent la méthode dominante pour construire des agents IA et sont intrinsèquement liés à leur mémoire. Utiliser un harnais fermé, notamment via une API propriétaire, signifie céder le contrôle de votre agent.

Agent harnesses Proprietary APIs agent memory AI control

ARTICLEDEV.to AI·03/05/2026

Giving an AI agent permission to spawn sub-agents (without losing control)

Ce contenu examine l'octroi de permission à un agent IA pour générer des sous-agents, en se concentrant sur les stratégies de maintien du contrôle. Il aborde la gestion de l'autonomie des systèmes multi-agents sans perdre la supervision humaine.

AI control Agent autonomy multi-agent systems AI agents