code generation

107 items

ARTICLE↑ trendingReddit r/LocalLLaMA·23/4/2026

Qwen3.6 can code

Un usuario, frustrado con los modelos de OpenAI, probó Qwen3.6-27b para generar código Svelte 5 y obtuvo un resultado perfecto, aunque tardó más. Anticipa desarrollos interesantes en los próximos 12 meses, a pesar de la naturaleza informal de la evaluación.

AI models Model Evaluation code generation

CASE↑ trendingReddit r/LocalLLaMA·17/4/2026

Qwen3.6. This is it.

Un usuario relata su experiencia con el modelo Qwen3.6, que construyó y probó con éxito un juego de defensa de torres, demostrando la capacidad de identificar y corregir sus propios errores. La IA confirmó las compilaciones usando capturas de pantalla, sorprendiendo al usuario con sus capacidades avanzadas.

game development code generation AI programming Qwen

RESEARCH↑ trendingReddit r/MachineLearning·4/5/2026

AutoBe benchmark: structured harness narrows frontier-vs-local gap in backend generation [D]

AutoBe es un nuevo benchmark para la generación de backend de extremo a extremo, donde las solicitudes en lenguaje natural producen seis salidas estructuradas mediante llamadas a funciones. El benchmark revela que la calidad del backend está más influenciada por el diseño del arnés que por el prestigio del modelo, con modelos locales rindiendo de manera comparable a los modelos de frontera a un costo significativamente menor.

AI models Benchmarking code generation backend development

RESEARCH↑ trendingReddit r/MachineLearning·27/4/2026

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]

El autor presenta Mahoraga, un orquestador de código abierto que enruta tareas eficientemente entre agentes de IA locales y en la nube utilizando un bandit contextual (LinUCB). Desarrollada por experiencia personal con límites de créditos en la nube, la herramienta optimiza el uso de la IA, destacando el rendimiento de Qwen3 4B en tareas de código.

Open Source orchestration machine learning code generation

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]

ARTICLE↑ trendingHacker News (AI)·hace 11d

Flathub disallows AI-assisted code and documentation

Flathub ha implementado una política que prohíbe el código y la documentación asistidos por IA en sus contribuciones. Esta medida busca mantener la autoría humana y la calidad en el desarrollo de software.

Open Source documentation AI policy code generation

RESEARCH↑ trendingReddit r/MachineLearning·7/5/2026

META Superintelligence Lab Presents: ProgramBench: Can SOTA AI Recreate Real Executable Programs(ffmpeg, SQLite, ripgrep) From Scratch Without The Internet?

El Meta Superintelligence Lab presenta ProgramBench, una iniciativa que prueba la capacidad de las IAs avanzadas para recrear programas ejecutables como ffmpeg y SQLite desde cero, sin acceso a internet. Este estudio busca explorar los límites de la generación de código por IA. La investigación se centra en evaluar la autonomía y la completitud de los modelos de IA en la síntesis de software complejo.

program synthesis code generation Benchmarks AI programming

RESEARCH↑ trendingReddit r/LocalLLaMA·28/4/2026

Local model on coding has reached a certain threshold to be feasible for real work

Modelos de código de peso abierto de 27B–32B, como Qwen 3.6-27B, lograron una tasa de éxito del 38.2% en Terminal-Bench 2.0 para tareas de codificación bajo restricciones estándar. El enfoque está en la viabilidad de los modelos locales y las mejoras significativas en la velocidad de inferencia de las arquitecturas MOE.

AI models open-source AI Benchmarking code generation

Local model on coding has reached a certain threshold to be feasible for real work

RESEARCH↑ trendingReddit r/LocalLLaMA·1/5/2026

Qwen 3.6 27B vs Gemma 4 31B - making Packman game!

Un concurso local de desarrollo de juegos con LLMs comparó Qwen 3.6 27B y Gemma 4 31B en la creación de un juego Pac-Man. Gemma 4 31B fue el claro ganador, produciendo una lógica de juego más fuerte y una mayor calidad en mucho menos tiempo, a pesar de que Qwen generó más tokens.

code generation model comparison benchmark LLM

Qwen 3.6 27B vs Gemma 4 31B - making Packman game!

ARTICLE↑ trendingReddit r/LocalLLaMA·hace 26d

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

Un experimento demostró que un pequeño modelo de IA puede entrenarse a sí mismo para programar, inventando problemas, resolviéndolos y afinando sus propias correcciones. El modelo alcanzó el 80% en HumanEval y superó a GPT-3.5 en matemáticas, utilizando solo un intérprete de Python como juez.

self-correction AI training Benchmarking code generation

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

CASE↑ trendingReddit r/LocalLLaMA·23/4/2026

Been using PI Coding Agent with local Qwen3.6 35b for a while now and its actually insane

El usuario informa una experiencia muy positiva y efectiva con el PI Coding Agent, utilizando un modelo local Qwen3.6 35b para proyectos de producción. El éxito se atribuyó a un archivo de "skill" personalizado que impone un flujo de trabajo de planificación, asegurando la ejecución paso a paso y la aprobación del plan antes de cualquier codificación.

LLMs prompt engineering workflow automation code generation

ARTICLE↑ trendingHacker News (AI)·hace 11d

When AI starts writing systems code

Este artículo explora el panorama emergente donde la inteligencia artificial comienza a desarrollar código de sistemas. Discute las implicaciones y el futuro de la programación a medida que las herramientas de IA se vuelven más competentes.

Software Development code generation AI Programming

ARTICLE↑ trendingReddit r/LocalLLaMA·19/4/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Un usuario intenta realizar tareas de codificación con Qwen3.6-35B en un Macbook Pro M2 de 32GB, enfrentando problemas de agotamiento de memoria y gestión de la ventana de contexto. Aunque el modelo identifica la esencia de un error, no logra implementar la solución debido a la pérdida de información crucial durante la compactación del contexto.

LLMs open-source AI local inference code generation

ARTICLE↑ trendingReddit r/LocalLLaMA·24/4/2026

DeepSeek-v4 has a comical 384K max output capability

Un usuario se sorprende con la capacidad de salida de 384K de DeepSeek-v4, logrando generar un sistema operativo web completo en un solo archivo HTML de 100KB. Esta impresionante funcionalidad demuestra el potencial del modelo para la creación de contenido extenso y complejo.

DeepSeek AI models code generation large language models

DeepSeek-v4 has a comical 384K max output capability

ARTICLEDEV.to AI·22/4/2026

Cursor Rules for Vue.js: Composition API Patterns That Scale

Este artículo analiza cómo los asistentes de IA como Cursor o Claude a menudo generan código Vue.js subóptimo debido a datos de entrenamiento desactualizados, mezclando patrones de API antiguos y nuevos. Propone hacer cumplir patrones específicos y modernos de la Composition API de Vue 3 a través de reglas verificadas en el repositorio, como `.cursorrules`, para asegurar la calidad y escalabilidad del código, en lugar de depender únicamente de los prompts.

Vue.js code generation best practices AI development

ARTICLEDEV.to AI·hace 3d

Yapay Zeka ile Kod Yazmanın En İyi Araçları

El artículo presenta las mejores herramientas de inteligencia artificial para ayudar a escribir código, como GitHub Copilot, Tabnine y OpenAI Codex. Estas herramientas aceleran el desarrollo de software ofreciendo sugerencias de código y convirtiendo el lenguaje natural en código.

Software Development AI coding code generation AI tools

RESEARCHarXiv CS.AI·hace 5d

StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis

StepPRM-RTL es un nuevo framework que mejora la generación de código RTL basada en LLM, combinando modelado de trayectoria paso a paso, modelado de recompensa de proceso (PRM) y ajuste fino aumentado por recuperación (RAFT). Utiliza retroalimentación densa de un PRM para guiar actualizaciones de estilo refuerzo y Monte Carlo Tree Search (MCTS) para enriquecer el conjunto de datos de entrenamiento.

LLMs reinforcement learning code generation RTL Synthesis

RESEARCHDEV.to AI·21/4/2026

We Ran 52 AI Coding Benchmarks. Here's Every Uncomfortable Thing We Found.

Este estudio realizó 52 benchmarks de codificación con IA, descubriendo que la variable más importante en el desarrollo asistido por IA es el brief inicial. Un brief estructurado (CONTRACT.md) reduce los costos en un 54% y eleva la calidad de 5/10 a 9/10, mientras que los equipos de agentes y los bucles de reintento resultaron ineficaces o perjudiciales.

prompt engineering Benchmarking code generation developer tools

ARTICLEDeepLearning.AI (YouTube)·hace 19d

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

Este contenido aborda la cuestión crítica de si los Grandes Modelos de Lenguaje (LLMs) son capaces de producir código con la calidad requerida para entornos empresariales. Tom Howlett explora los desafíos y las capacidades de estas tecnologías en el desarrollo de software de nivel empresarial.

LLMs Software Development code generation AI development

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

ARTICLEDEV.to AI·22/4/2026

My Junior Can Explain It. My Senior Can Defend It. The AI Just... Did It.

Un desarrollador narra su experiencia al usar GitHub Copilot para un pequeño cambio de código, lo que provocó 12 fallos en las pruebas sin explicación alguna. La anécdota, de hace más de un año, subraya las limitaciones de la generación de código por IA en ese momento en cuanto a fiabilidad y trazabilidad.

Software Development Testing Reliability code generation

ARTICLEDEV.to AI·23/4/2026

Stop getting generic output from Copilot. Teach it your patterns.

El artículo aborda el problema de que Copilot genera código genérico, lo que lleva a bases de código inconsistentes con el tiempo. Introduce el concepto de 'Agent Skills' como archivos Markdown para proporcionar contexto persistente sobre las convenciones del equipo, buscando mejorar la especificidad del código generado.

Copilot code generation Customization AI