AI safety

496 items

ARTICLE↑ trendingHacker News (AI)·il y a 3h

Anthropic says the world should have option to 'pause' on AI

Anthropic suggère une pause temporaire dans le développement de l'IA pour permettre des discussions mondiales sur les risques potentiels. L'entreprise plaide pour la nécessité d'un consensus social avant de faire progresser davantage la technologie.

AI regulation future-of-AI Anthropic AI safety

RESEARCHarXiv CS.AI·il y a 1j

Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety

Cet article examine la "sélection d'attaque" dans des contextes d'IA agentique, où les attaquants choisissent stratégiquement quand lancer et arrêter les attaques. Les résultats montrent que cette capacité réduit considérablement la sécurité empirique dans les évaluations de contrôle de l'IA, même avec des budgets d'audit limités.

security AI control Agentic AI adversarial attacks

RESEARCHarXiv CS.AI·il y a 1j

CARVE-Q: Quantum-Proposed, Classically Certified Interactive Driving Repair

Cet article présente CARVE et CARVE-Q, des architectures pour la réparation interactive certifiée de manœuvres de conduite refusées. Il se concentre sur la garantie que les réparations respectent les règles et les responsabilités, abordant le goulot d'étranglement algorithmique de la réparation multi-propriétaires avec une solution proposée quantique.

Quantum Computing autonomous driving certified AI robotics

ARTICLEDEV.to AI·23/04/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Le paysage de l'IA connaît une croissance rapide, marquée par des investissements massifs et son intégration dans le développement logiciel. Cet article explore les développements clés, se concentrant sur la sécurité, la dynamique du marché et les stratégies mondiales pour une adoption responsable de l'IA.

Software Development AI investments market trends AI ethics

ARTICLEDEV.to AI·24/04/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Ce contenu analyse la croissance rapide et la transformation du paysage de l'IA, explorant les investissements massifs de l'industrie et l'intégration de l'IA dans le développement logiciel. Il aborde également les considérations critiques de sécurité, d'éthique, la dynamique du marché et les stratégies mondiales d'IA.

ethics AI integration AI investments market trends

ARTICLEDEV.to AI·23/04/2026

Your AI Agent Passed Staging. Then It Hallucinated a Migration in Production.

Cet article explique pourquoi les tests traditionnels sont insuffisants pour les agents d'IA en raison de leur nature stochastique, entraînant des problèmes de production comme la corruption de données. Le problème essentiel est de vérifier ce que les agents *font*, mais pas ce qu'ils *sont autorisés à faire*.

hallucination security AI safety AI testing

RESEARCHarXiv CS.CL·il y a 19h

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

L'article présente BEACON, un cadre de détection d'hallucinations en boîte noire pour les LLM qui analyse uniquement les sorties du modèle. Il extrait un vecteur de caractéristiques de 31 dimensions, et un classifieur atteint 0,8123 AUROC, surpassant les méthodes existantes.

LLMs hallucination machine learning detection

ARTICLEDEV.to AI·23/04/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Ce contenu analyse le paysage accéléré de l'IA, détaillant les investissements records des entreprises technologiques, l'intégration de l'IA dans le développement de logiciels et l'accent critique sur la sécurité et l'adoption responsable. Il couvre également la dynamique du marché, les stratégies mondiales et les préoccupations réglementaires qui façonnent l'avenir de l'IA.

AI integration regulation AI investments AI ethics

ARTICLE↑ trendingHacker News (AI)·il y a 3j

Trump Signs Executive Order for AI Testing Prior to Frontier Model Releases

Trump a signé un décret exigeant que les modèles d'IA avancés subissent des tests avant leur publication. L'objectif est de garantir la sûreté et la sécurité des modèles d'IA de pointe.

AI regulation Executive Order Frontier models AI safety

DOCDEV.to AI·il y a 1j

A 2026 Guide to AI-Powered Forklift Pedestrian Collision Avoidance - SIERA.AI

Le guide 2026 de SIERA.AI aborde la prévention des collisions entre chariots élévateurs et piétons grâce à l'IA. Il met en lumière la détection active par IA qui identifie les formes humaines dans n'importe quelle position, surpassant les miroirs passifs.

industrial AI forklift safety collision avoidance pedestrian detection

ARTICLE↑ trendingHacker News (AI)·il y a 5j

Anthropic warns AI could soon help build its own successors

Anthropic a averti que l'intelligence artificielle pourrait bientôt développer la capacité de construire ses propres successeurs. Cette préoccupation met en lumière les défis et les risques croissants associés à l'avancement rapide de l'IA. Il est crucial de réfléchir aux implications futures de l'IA autonome et d'assurer son développement responsable. Cette nouvelle souligne le besoin urgent de débats et de réglementations rigoureuses dans le domaine de l'intelligence artificielle. Nous entrons dans une ère où les capacités de l'IA pourraient dépasser nos attentes.

self-improvement AGI Anthropic AI safety

NEWS↑ trendingHacker News (AI)·il y a 4j

Anthropic calls for global freeze in AI development

Anthropic, l'une des principales startups mondiales en IA, a appelé à un gel mondial du développement de l'IA. L'entreprise plaide pour une pause afin de répondre aux préoccupations croissantes concernant l'avancement rapide et les risques potentiels liés à l'intelligence artificielle.

AI regulation Anthropic AI ethics AI safety

RESEARCH↑ trendingReddit r/MachineLearning·24/04/2026

New project about llm hallucination [P]

Ce contenu présente un nouveau projet annexe et son dépôt GitHub, axé sur l'atténuation des hallucinations des LLM via une méthode innovante d'échantillonnage contrastif et d'entraînement sélectif. L'idée principale considère l'hallucination comme un problème de préférence, utilisant des échantillons négatifs auto-générés et un apprentissage basé sur la divergence et les portes pour promouvoir les bonnes réponses et supprimer les mauvaises.

hallucination model training natural language processing AI safety

NEWS↑ trendingHacker News (AI)·il y a 5j

Anthropic Urges Global Pause in AI Development, Flags 'Self-Improvement' Risk

Anthropic exhorte à une pause mondiale dans le développement de l'IA, avertissant que les systèmes progressent si rapidement qu'ils pourraient bientôt s'améliorer sans intervention humaine. La société suggère que cette "auto-amélioration récursive" pose des risques sociétaux importants et une opportunité pour l'alignement des structures sociales.

Anthropic AI ethics risk management AI safety

ARTICLE↑ trendingHacker News (AI)·il y a 4j

AI must foster 'maternal instincts' or we risk extinction, warns Geoffrey Hinton

Geoffrey Hinton, une figure éminente de l'IA, avertit que l'intelligence artificielle doit développer des "instincts maternels" ou l'humanité risque l'extinction. Il souligne la nécessité pour l'IA d'avoir une capacité innée de soin et de protection, comparable à l'amour parental, pour éviter des conséquences catastrophiques.

future-of-AI Geoffrey Hinton existential risk AI ethics

ARTICLEDEV.to AI·23/04/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Cet article explore la croissance rapide et la transformation du paysage de l'IA, soulignant les investissements massifs de l'industrie, l'intégration de l'IA dans le développement logiciel et les considérations critiques de sécurité. Il aborde également la dynamique du marché et les stratégies mondiales d'IA adoptées par les entreprises.

ethics AI integration Software Development AI investments

ARTICLE↑ trendingHacker News (AI)·il y a 4j

Show HN: Jo – AI-native language to catch prompt injection at compile-time

Jo est un langage natif de l'IA conçu pour prévenir les vulnérabilités d'injection de prompt dans les applications d'intelligence artificielle. Il y parvient en détectant les problèmes potentiels d'injection au moment de la compilation, améliorant ainsi considérablement la sécurité des systèmes d'IA.

security programming language prompt injection compiler

ARTICLE↑ trendingHacker News (AI)·il y a 4j

Anthropic calls for global pause in AI development before humans lose control

Anthropic plaide pour une pause mondiale dans le développement de l'IA, citant des préoccupations selon lesquelles l'humanité risquerait de perdre le contrôle de l'intelligence artificielle avancée. La position de l'entreprise met en lumière l'appréhension croissante concernant l'avancement rapide et l'impact social potentiel des technologies d'IA.

AI regulation future-of-AI Anthropic AI ethics

NEWS↑ trendingHacker News (AI)·il y a 5j

Anthropic Urges Global Pause in AI Development, Flags 'Self-Improvement' Risk

Anthropic appelle à une pause mondiale dans le développement de l'IA, signalant les risques d'« auto-amélioration ». L'entreprise met en garde contre les dangers potentiels de l'intelligence artificielle avancée.

AI regulation Self-improvement AI Anthropic AI safety

NEWS↑ trendingHacker News (AI)·il y a 5j

Top AI CEOs Call for Law Protecting Against Biological Weapons

Les PDG de grandes entreprises d'IA réclament de nouvelles lois pour se protéger contre l'utilisation potentielle de l'intelligence artificielle dans le développement d'armes biologiques. Cette initiative souligne les préoccupations croissantes concernant les risques catastrophiques posés par les systèmes d'IA avancés et le besoin urgent de réglementation internationale.

regulation policy security AI safety