large language models

262 items

DOCAndrej Karpathy (YouTube)·11/23/2023

[1hr Talk] Intro to Large Language Models

Dies ist ein einstündiger Vortrag, der eine umfassende Einführung in Große Sprachmodelle (LLMs) bietet. Er behandelt die grundlegenden Konzepte und die Funktionsweise dieser leistungsstarken KI-Technologien.

learning large language models

[1hr Talk] Intro to Large Language Models

DOCAndrej Karpathy (YouTube)·1/17/2023

Let's build GPT: from scratch, in code, spelled out.

Dieser Inhalt bietet ein detailliertes Tutorial zum Aufbau eines GPT-Modells von Grund auf, wobei jeder Implementierungsschritt im Code erklärt wird. Es dient als praktischer Leitfaden zum Verständnis der Architektur und Funktionalität großer Sprachmodelle.

GPT learning large language models AI development

Let's build GPT: from scratch, in code, spelled out.

DOCAndrej Karpathy (YouTube)·6/9/2024

Let's reproduce GPT-2 (124M)

Dieser Inhalt bietet eine Anleitung zur Reproduktion des GPT-2 (124M) Modells, in der die notwendigen Schritte zur Nachbildung dieser Spracharchitektur detailliert beschrieben werden. Es dient als praktisches Tutorial für KI-Enthusiasten und Entwickler.

learning GPT-2 machine learning large language models

ARTICLEThe AI Epiphany (YouTube)·7/3/2024

Best LLM? Qwen 2 LLM w/ author Junyang Lin

Dieser Inhalt diskutiert Qwen 2, ein großes Sprachmodell, möglicherweise unter Berücksichtigung seiner Fähigkeiten oder im Vergleich zu anderen LLMs, mit Einblicken des Autors Junyang Lin.

AI models Qwen 2 large language models LLM

Best LLM? Qwen 2 LLM w/ author Junyang Lin

ARTICLEThe AI Epiphany (YouTube)·9/16/2024

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

Dieser Inhalt behandelt Imbues ehrgeiziges Projekt, ein 70B KI-Modell komplett von Grund auf neu zu trainieren. Es zeigt Bowei, den Leiter der Infrastruktur, der Einblicke in die Herausforderungen und Prozesse eines so groß angelegten Unterfangens gibt.

model training Imbue infrastructure large language models

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

ARTICLEDEV.to AI·4/11/2026

Best GirlfriendGPT Alternative in 2026: Why AI Angels Wins

Der Artikel erörtert die Entwicklung von KI-Begleitanwendungen und positioniert AI Angels als überlegene Alternative zu GirlfriendGPT im Jahr 2026. Er hebt hervor, dass Nutzer bedeutungsvollere, personalisiertere und privatere Erfahrungen suchen, und identifiziert AI Angels als die definitive Wahl für das beste KI-Freundin-Erlebnis.

AI Angels AI girlfriends large language models AI companions

ARTICLEDEV.to AI·4/27/2026

The next phase of the Microsoft OpenAI partnership

Die nächste Phase der Microsoft OpenAI-Partnerschaft konzentriert sich auf die Integration fortschrittlicher OpenAI-Modelle, einschließlich des GPT-4 mit einer Billion Parametern, in Microsoft-Produkte wie Azure, Dynamics und Office. Dies soll Entwicklern ermöglichen, KI-gestützte Anwendungen auf der Cloud-Plattform zu erstellen und bereitzustellen.

GPT-4 AI integration cloud computing AI partnership

ARTICLEDEV.to AI·4/15/2026

Why Does AI Just... Make Stuff Up?

Dieser Artikel untersucht die grundlegenden Gründe, warum künstliche Intelligenz dazu neigt, falsche oder erfundene Informationen zu generieren, oft als "Halluzinationen" bezeichnet. Er beleuchtet die Mechanismen, die dazu führen, dass KI-Modelle "Dinge erfinden", und diskutiert die Auswirkungen auf ihre Zuverlässigkeit und Vertrauenswürdigkeit.

AI hallucinations AI limitations AI reliability large language models

DOCfast.ai Blog·11/6/2025

A Guide to Solveit Features

Große Sprachmodelle erleichtern die Codegenerierung erheblich, führen aber oft zu Code, den Entwickler nicht verstehen. Dieser Mangel an Verständnis erschwert die Änderung, Fehlerbehebung oder das Hinzufügen von Funktionen zu KI-generiertem Code.

code maintainability code generation large language models Software Engineering

ARTICLEDEV.to AI·4/13/2026

AI Agents vs RPA: Which Automation Technology Is Better?

Dieser Artikel vergleicht KI-Agenten und RPA und hebt hervor, dass RPA repetitive Aufgaben auf Benutzeroberflächen automatisiert, während KI-Agenten LLMs für logisches Denken und Anpassung nutzen. Die Wahl hängt vom Bedarf an deterministischer Wiederholung oder intelligenter Entscheidungsfindung ab, wobei viele Organisationen einen hybriden Ansatz verfolgen.

workflow automation large language models automation RPA

NEWSDEV.to AI·4/26/2026

DeepSeek-V4 Ported to MLX for Apple Silicon Inference

DeepSeek-V4 wurde auf Apples MLX-Framework portiert, sodass das große Sprachmodell auf Apple Silicon Macs ausgeführt werden kann. Die funktionale Portierung, eine Community-Leistung von @Prince_Canuma, erfordert noch Optimierungen für eine verbesserte Leistung.

apple-silicon local inference MLX large language models

ARTICLEDEV.to AI·4/24/2026

Qwen3.6-Plus for Coding: When It Beats Qwen3.5-Plus

Qwen3.6-Plus übertrifft Qwen3.5-Plus bei komplexen, mehrstufigen Codierungsaufgaben, die Code-Inspektion, Planung und integrierte Tool-Nutzung erfordern. Während 3.5-Plus gut für kurze Code-Snippets ist, behält 3.6-Plus den Kontext in Workflows bei, die Terminalbefehle, Suche und Browsing umfassen.

AI models software development tool use large language models

ARTICLEDEV.to AI·4/8/2026

Understanding Tokens and Context Windows

Tokens são os blocos de construção fundamentais dos Large Language Models (LLMs), que preveem a próxima sequência de texto com base em unidades menores. Essa quebra do texto em tokens é essencial para o funcionamento dos sistemas de completação de chat.

LLMs Inteligência Artificial context windows large language models

ARTICLEDEV.to AI·4/11/2026

You Don’t Need “Prompt Engineering” to Talk to AI

Dieser Artikel argumentiert, dass "Prompt Engineering" für normale Nutzer überschätzt wird, da die Interaktion mit großen Sprachmodellen so einfach ist wie ein Gespräch. Der Autor, ein KI-Student, schlägt einen einfachen Ansatz vor, um ohne fortgeschrittenes technisches Wissen gute Ergebnisse zu erzielen.

AI interaction User Guide prompt-engineering AI

ARTICLEDEV.to AI·4/13/2026

The Expensive Anxiety of AI

Der Artikel analysiert die erheblichen Ressourcen und Rechenkosten, die mit dem Training und der Bereitstellung von KI-Modellen, insbesondere großen Sprachmodellen, verbunden sind. Er erörtert den Bedarf an massiven Daten, komplexen Matrixoperationen und spezialisierter Hardware wie GPUs und TPUs sowie Techniken wie verteilte und parallele Verarbeitung.

GPU computational costs large language models TPU

ARTICLEDEV.to AI·4/6/2026

I built a GitHub App that auto-writes PR descriptions — here's what happened in 8 days

O autor relata a criação e os resultados de um aplicativo GitHub baseado em IA, desenvolvido para gerar automaticamente descrições de pull requests, após 8 dias de uso.

GitHub productivity AI large language models

ARTICLEOpenAI Blog·4/10/2026

AI fundamentals

Dieser einsteigerfreundliche Leitfaden erklärt die Grundlagen der künstlichen Intelligenz (KI), ihre Funktionsweise sowie die Anwendung großer Sprachmodelle in Tools wie ChatGPT.

ai-fundamentals beginner guide ChatGPT large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·4/28/2026

Duality of r/LocalLLaMA

Dieser Inhalt ist ein Reddit-Posttitel, der eine Diskussion über die dualen oder kontrastierenden Aspekte der r/LocalLLaMA-Community vorschlägt, die sich auf lokale Sprachmodelle konzentriert.

AI Community Reddit large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·4/10/2026

the state of LocalLLama

Este conteúdo apresenta uma análise sobre o estado atual do projeto LocalLLama. Ele explora os avanços e desafios que envolvem os Large Language Models locais.

open-source AI Local LLMs AI large language models

NEWSDEV.to AI·4/24/2026

DeepSeek V4 Rivoluziona l'IA con un Contesto da 1 Milione di Token e Ragionamento di Classe Mondiale

DeepSeek V4 revolutioniert die KI durch die Einführung eines Kontextfensters von 1 Million Tokens und erstklassigen Denkfähigkeiten. Die Ankündigung fasst die wichtigsten Punkte zusammen, wobei eine detailliertere Analyse im vollständigen Artikel verfügbar ist.

DeepSeek AI models Context window Reasoning