code generation

107 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/23/2026

Qwen3.6 can code

Ein Benutzer, frustriert von OpenAI-Modellen, testete Qwen3.6-27b für die Svelte 5-Codegenerierung und erzielte ein perfektes Ergebnis, obwohl es länger dauerte. Er erwartet interessante Entwicklungen in den nächsten 12 Monaten, trotz des informellen Charakters der Bewertung.

AI models Model Evaluation code generation

CASE↑ trendingReddit r/LocalLLaMA·4/17/2026

Qwen3.6. This is it.

Ein Nutzer berichtet von seiner Erfahrung mit dem Qwen3.6-Modell, das erfolgreich ein Tower-Defense-Spiel erstellte und testete und dabei die Fähigkeit zeigte, eigene Fehler zu identifizieren und zu beheben. Die KI bestätigte die Builds mittels Screenshots, was den Nutzer mit ihren fortschrittlichen Fähigkeiten verblüffte.

game development code generation AI programming Qwen

RESEARCH↑ trendingReddit r/MachineLearning·5/4/2026

AutoBe benchmark: structured harness narrows frontier-vs-local gap in backend generation [D]

AutoBe ist ein neuer Benchmark für die End-to-End-Backend-Generierung, bei dem natürliche Sprachanfragen sechs strukturierte Ausgaben mittels strukturierter Funktionsaufrufe erzeugen. Der Benchmark zeigt, dass die Backend-Qualität stärker vom Harness-Design als vom Modell-Prestige beeinflusst wird, wobei lokale Modelle vergleichbar gut wie führende Modelle zu deutlich geringeren Kosten abschneiden.

AI models Benchmarking code generation backend development

RESEARCH↑ trendingReddit r/MachineLearning·4/27/2026

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]

Der Autor stellt Mahoraga vor, einen Open-Source-Orchestrator, der Aufgaben mittels eines kontextuellen Banditen (LinUCB) effizient zwischen lokalen und Cloud-KI-Agenten leitet. Aus persönlicher Erfahrung mit Cloud-Guthaben-Limits entstanden, optimiert das Tool die KI-Nutzung und hebt die Leistung von Qwen3 4B bei Code-Aufgaben hervor.

Open Source orchestration machine learning code generation

Qwen3 4B outperforms cloud agents on code tasks—with Mahoraga research [R]

ARTICLE↑ trendingHacker News (AI)·vor 11T

Flathub disallows AI-assisted code and documentation

Flathub hat eine Richtlinie eingeführt, die KI-unterstützten Code und Dokumentation in seinen Beiträgen verbietet. Diese Maßnahme zielt darauf ab, die menschliche Urheberschaft und Qualität in der Softwareentwicklung zu gewährleisten.

Open Source documentation AI policy code generation

RESEARCH↑ trendingReddit r/MachineLearning·5/7/2026

META Superintelligence Lab Presents: ProgramBench: Can SOTA AI Recreate Real Executable Programs(ffmpeg, SQLite, ripgrep) From Scratch Without The Internet?

Das Meta Superintelligence Lab stellt ProgramBench vor, eine Initiative, die die Fähigkeit fortschrittlicher KIs testet, ausführbare Programme wie ffmpeg und SQLite von Grund auf neu zu erstellen, ohne Internetzugang. Diese Studie zielt darauf ab, die Grenzen der KI-Codegenerierung zu erforschen. Die Forschung konzentriert sich auf die Bewertung der Autonomie und Vollständigkeit von KI-Modellen bei der komplexen Softwaresynthese.

program synthesis code generation Benchmarks AI programming

RESEARCH↑ trendingReddit r/LocalLLaMA·4/28/2026

Local model on coding has reached a certain threshold to be feasible for real work

Open-Weight-Code-Modelle (27B–32B), wie Qwen 3.6-27B, erreichten auf Terminal-Bench 2.0 eine Erfolgsquote von 38,2 % für Codierungsaufgaben unter Standardbedingungen. Der Fokus liegt auf der Machbarkeit lokaler Modelle und den erheblichen Geschwindigkeitsverbesserungen von MOE-Architekturen.

AI models open-source AI Benchmarking code generation

Local model on coding has reached a certain threshold to be feasible for real work

RESEARCH↑ trendingReddit r/LocalLLaMA·5/1/2026

Qwen 3.6 27B vs Gemma 4 31B - making Packman game!

Ein lokaler LLM-Spieleentwicklungs-Wettbewerb verglich Qwen 3.6 27B und Gemma 4 31B bei der Erstellung eines Pac-Man-Spiels. Gemma 4 31B war der klare Gewinner und lieferte eine stärkere Spiellogik sowie höhere Qualität in deutlich kürzerer Zeit, obwohl Qwen mehr Token generierte.

code generation model comparison benchmark LLM

Qwen 3.6 27B vs Gemma 4 31B - making Packman game!

ARTICLE↑ trendingReddit r/LocalLLaMA·vor 26T

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

Ein Experiment zeigte, dass ein kleines KI-Modell sich selbst zum Programmieren trainieren kann, indem es Probleme erfindet, sie löst und sich anhand eigener Korrekturen feinabstimmt. Das Modell erreichte 80% bei HumanEval und übertraf GPT-3.5 in Mathematik, wobei nur ein Python-Interpreter als Richter diente.

self-correction AI training Benchmarking code generation

I Let a Small Model Train on Its Own Mistakes. It Reached 80% on HumanEval and Beat GPT-3.5 on Math

CASE↑ trendingReddit r/LocalLLaMA·4/23/2026

Been using PI Coding Agent with local Qwen3.6 35b for a while now and its actually insane

Der Benutzer berichtet von einer äußerst positiven und effektiven Erfahrung mit dem PI Coding Agent und einem lokalen Qwen3.6 35b Modell in Produktionsprojekten. Der Erfolg wurde einer benutzerdefinierten „Plan-First Skill-Datei“ zugeschrieben, die einen strukturierten Planungs-Workflow erzwingt und eine schrittweise Ausführung sowie die Planfreigabe vor der Codierung sicherstellt.

LLMs prompt engineering workflow automation code generation

ARTICLE↑ trendingHacker News (AI)·vor 11T

When AI starts writing systems code

Dieser Artikel beleuchtet das aufkommende Szenario, in dem künstliche Intelligenz beginnt, Systemcode zu entwickeln. Er erörtert die Auswirkungen und die Zukunft der Programmierung, da KI-Tools immer kompetenter werden.

Software Development code generation AI Programming

ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Ein Benutzer versucht, Programmierarbeiten mit Qwen3.6-35B auf einem M2 Macbook Pro mit 32 GB RAM durchzuführen, stößt jedoch auf Probleme mit Speicherausschöpfung und Kontextfensterverwaltung. Obwohl das Modell die Kernursache eines Fehlers erkennt, scheitert es an der Implementierung, da wichtige Informationen während der Kontextkomprimierung verloren gehen.

LLMs open-source AI local inference code generation

ARTICLE↑ trendingReddit r/LocalLLaMA·4/24/2026

DeepSeek-v4 has a comical 384K max output capability

Ein Nutzer ist schockiert über die 384K maximale Ausgabekapazität von DeepSeek-v4, das es schaffte, ein umfassendes Einzel-HTML-Web-OS in einer 100KB-Datei zu generieren. Diese beeindruckende Funktionalität zeigt das Potenzial des Modells für die Erstellung umfangreicher und komplexer Inhalte.

DeepSeek AI models code generation large language models

DeepSeek-v4 has a comical 384K max output capability

ARTICLEDEV.to AI·4/22/2026

Cursor Rules for Vue.js: Composition API Patterns That Scale

Dieser Artikel behandelt, wie KI-Assistenten wie Cursor oder Claude aufgrund veralteter Trainingsdaten oft suboptimalen Vue.js-Code generieren, der alte und neue API-Muster mischt. Er schlägt vor, spezifische, moderne Vue 3 Composition API-Muster durch im Repository geprüfte Regeln wie `.cursorrules` durchzusetzen, um Codequalität und Skalierbarkeit zu gewährleisten, anstatt sich nur auf Prompts zu verlassen.

Vue.js code generation best practices AI development

ARTICLEDEV.to AI·vor 3T

Yapay Zeka ile Kod Yazmanın En İyi Araçları

Der Artikel stellt die besten KI-gestützten Tools zum Schreiben von Code vor, darunter GitHub Copilot, Tabnine und OpenAI Codex. Diese Tools beschleunigen die Softwareentwicklung, indem sie Codevorschläge liefern und natürliche Sprache in Code umwandeln.

Software Development AI coding code generation AI tools

RESEARCHarXiv CS.AI·vor 5T

StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis

StepPRM-RTL ist ein neuartiges Framework, das die LLM-basierte RTL-Codegenerierung verbessert, indem es schrittweise Trajektorienmodellierung, Prozess-Reward-Modellierung (PRM) und retrieval-augmented Fine-Tuning (RAFT) kombiniert. Es nutzt dichtes Feedback eines PRM, um verstärkungsbasierte Updates zu leiten, und Monte Carlo Tree Search (MCTS) zur Anreicherung des Trainingsdatensatzes.

LLMs reinforcement learning code generation RTL Synthesis

RESEARCHDEV.to AI·4/21/2026

We Ran 52 AI Coding Benchmarks. Here's Every Uncomfortable Thing We Found.

Die Studie führte 52 KI-Codierungsbenchmarks durch und zeigte, dass die größte Variable bei der KI-gestützten Entwicklung der anfängliche Brief ist. Ein strukturierter Brief (CONTRACT.md) senkt die Kosten um 54 % und steigert die Qualität von 5/10 auf 9/10, während Agenten-Teams und Wiederholungsschleifen sich als unwirksam oder schädlich erwiesen.

prompt engineering Benchmarking code generation developer tools

ARTICLEDeepLearning.AI (YouTube)·vor 19T

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

Dieser Inhalt untersucht die entscheidende Frage, ob große Sprachmodelle (LLMs) in der Lage sind, Code in der für Unternehmensumgebungen erforderlichen Qualität zu produzieren. Tom Howlett erforscht die Herausforderungen und Fähigkeiten dieser Technologien in der Entwicklung von Unternehmenssoftware.

LLMs Software Development code generation AI development

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

ARTICLEDEV.to AI·4/22/2026

My Junior Can Explain It. My Senior Can Defend It. The AI Just... Did It.

Ein Entwickler berichtet von seiner Erfahrung mit GitHub Copilot bei einer kleinen Codeänderung, die zu 12 Testfehlern ohne Erklärung führte. Die Anekdote, die über ein Jahr alt ist, unterstreicht die damaligen Einschränkungen der KI-Codegenerierung hinsichtlich Zuverlässigkeit und Nachvollziehbarkeit.

Software Development Testing Reliability code generation

ARTICLEDEV.to AI·4/23/2026

Stop getting generic output from Copilot. Teach it your patterns.

Der Artikel befasst sich mit dem Problem, dass Copilot generischen Code erzeugt, was im Laufe der Zeit zu inkonsistenten Codebasen führt. Er stellt das Konzept der „Agent Skills“ als Markdown-Dateien vor, um persistenten Kontext zu Teamkonventionen bereitzustellen und so die Spezifität des generierten Codes zu verbessern.

Copilot code generation Customization AI