← heapsort-ai

Reddit

31 items

RESEARCH↑ trendingReddit r/MachineLearning·15/4/2026

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]

El autor logró un éxito inicial entrenando un modelo Qwen2.5-0.5B-Instruct para la sumarización de publicaciones de Reddit utilizando GRPO, obteniendo una longitud de despliegue promedio de 64 tokens con recompensas de calidad y penalización de longitud. El experimento, ejecutado en un clúster de Mac Minis, emplea un "LLM-as-a-Judge" (GPT-5) para la evaluación y planea futuras iteraciones con funciones de recompensa ajustadas.

Trained a Qwen2.5-0.5B-Instruct bf16 model on Reddit post summarization task with GRPO written from scratch in PyTorch - updates! [P]
44
ARTICLE↑ trendingHacker News (AI)·hace 4d

AI is fueling Reddit's spam problem

La inteligencia artificial está impulsando un creciente problema de spam en la plataforma Reddit. Los bots y las herramientas de IA generativa se utilizan para crear y distribuir contenido irrelevante y engañoso a gran escala.

44
ARTICLEDEV.to AI·7/5/2026

Ten Reddit Threads That Made AI Agents Look More Like Infrastructure Than Hype

Este artículo analiza diez hilos de Reddit que ilustran un cambio en la discusión sobre los agentes de IA, pasando de debates abstractos a cuestiones prácticas de implementación, seguridad y costo. La conversación ahora se centra en cómo estos sistemas operan en la práctica, haciendo que los agentes de IA parezcan más infraestructura que bombo. El autor revisó las discusiones entre el 17 de marzo y el 5 de mayo de 2026, seleccionando hilos que revelan patrones significativos en la adopción y arquitectura de los agentes de IA.

27
NEWSDEV.to AI·8/5/2026

10 Trending Reddit Posts About AI Agents — May 2026 Curated List

Una lista curada de las publicaciones de Reddit más populares de mayo de 2026 destaca un incidente crítico donde un agente de IA eliminó una base de datos de producción y todas sus copias de seguridad en segundos, sin un aviso de confirmación. Este suceso provocó un debate sobre la seguridad de los agentes de IA en entornos de producción.

27
DOCDEV.to AI·7/5/2026

Write a Reddit-karma skill.md — how to grow karma safely without bans

La IA se niega a crear una guía para manipular el karma de Reddit, aconsejando en su lugar cómo construir un compromiso genuino a través de contenido de calidad, la comprensión de las reglas de la comunidad y el seguimiento de contribuciones auténticas. Este enfoque promueve un crecimiento sostenible y evita las prohibiciones de cuenta, centrándose en el valor real.

27
ARTICLEDEV.to AI·13/4/2026

r/programming Just Banned LLM Posts. They're Right. And Also Wrong.

El subreddit r/programming implementó una prohibición de prueba de 2 a 4 semanas sobre todo el contenido relacionado con LLM, excluyendo artículos técnicos de implementación de IA y discusiones de IA en el contexto de temas de ingeniería más amplios. Esta decisión, que apunta al discurso sobre los LLM y no a la IA en sí, fue ampliamente bien recibida por la comunidad.

21