← heapsort-ai

AI safety

496 items

RESEARCHarXiv CS.AI·hace 1d

Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety

Este artículo investiga la "selección de ataque" en configuraciones de IA agéntica, donde los atacantes eligen estratégicamente cuándo iniciar y detener los ataques. Los hallazgos demuestran que esta capacidad reduce significativamente la seguridad empírica en las evaluaciones de control de IA, incluso con presupuestos de auditoría limitados.

60
ARTICLEDEV.to AI·23/4/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

El panorama de la IA está experimentando un rápido crecimiento, impulsado por inversiones masivas y su integración en el desarrollo de software. Este análisis profundiza en desarrollos clave, centrándose en la seguridad, la dinámica del mercado y las estrategias globales para una adopción responsable.

60
ARTICLEDEV.to AI·24/4/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

El contenido analiza el rápido crecimiento y la transformación del panorama de la IA, explorando las masivas inversiones de la industria y la integración de la IA en el desarrollo de software. También profundiza en consideraciones críticas de seguridad y ética, la dinámica del mercado y las estrategias globales de IA.

58
ARTICLEDEV.to AI·23/4/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Este contenido analiza el acelerado panorama de la IA, detallando inversiones récord de empresas tecnológicas, la integración de la IA en el desarrollo de software y el enfoque crítico en la seguridad y la adopción responsable. También cubre la dinámica del mercado, las estrategias globales y las preocupaciones regulatorias que dan forma al futuro de la IA.

48
ARTICLE↑ trendingHacker News (AI)·hace 5d

Anthropic warns AI could soon help build its own successors

Anthropic ha advertido que la inteligencia artificial pronto podría desarrollar la capacidad de construir sus propios sucesores. Esta preocupación resalta los crecientes desafíos y riesgos asociados con el rápido avance de la IA. Es crucial reflexionar sobre las futuras implicaciones de la IA autónoma y asegurar su desarrollo responsable. Esta noticia subraya la necesidad urgente de debates y regulaciones rigurosas en el campo de la inteligencia artificial. Estamos entrando en una era en la que las capacidades de la IA pueden superar nuestras expectativas.

46
RESEARCH↑ trendingReddit r/MachineLearning·24/4/2026

New project about llm hallucination [P]

Este contenido introduce un nuevo proyecto secundario y su repositorio de GitHub, centrado en mitigar la alucinación de LLM mediante un novedoso método de muestreo contrastivo y entrenamiento selectivo. La idea central trata la alucinación como un problema de preferencia, utilizando muestras negativas auto-generadas y un aprendizaje basado en divergencia y con compuertas para promover respuestas correctas y suprimir las incorrectas.

New project about llm hallucination [P]
45
NEWS↑ trendingHacker News (AI)·hace 5d

Anthropic Urges Global Pause in AI Development, Flags 'Self-Improvement' Risk

Anthropic insta a una pausa global en el desarrollo de la IA, advirtiendo que los sistemas están avanzando tan rápidamente que pronto podrían mejorarse a sí mismos sin intervención humana. La empresa sugiere que esta "auto-mejora recursiva" plantea riesgos sociales significativos y una oportunidad para que las estructuras sociales se alineen.

44
ARTICLE↑ trendingHacker News (AI)·hace 4d

AI must foster 'maternal instincts' or we risk extinction, warns Geoffrey Hinton

Geoffrey Hinton, una figura destacada en la IA, advierte que la inteligencia artificial debe fomentar "instintos maternales" o la humanidad corre el riesgo de extinción. Destaca la necesidad de que la IA tenga una capacidad innata de cuidado y protección, comparable al amor parental, para evitar resultados catastróficos.

44
ARTICLEDEV.to AI·23/4/2026

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Este artículo explora el rápido crecimiento y la transformación del panorama de la IA, destacando las grandes inversiones de la industria, la integración de la IA en el desarrollo de software y las consideraciones críticas de seguridad. También aborda la dinámica del mercado y las estrategias globales de IA adoptadas por las empresas.

44
NEWS↑ trendingHacker News (AI)·hace 5d

Top AI CEOs Call for Law Protecting Against Biological Weapons

Los principales CEOs de IA están pidiendo nuevas leyes para proteger contra el uso potencial de la inteligencia artificial en el desarrollo de armas biológicas. Esta iniciativa subraya las crecientes preocupaciones sobre los riesgos catastróficos que plantean los sistemas avanzados de IA y la necesidad urgente de regulación internacional.

43