large language models

262 items

DOCAndrej Karpathy (YouTube)·23/11/2023

[1hr Talk] Intro to Large Language Models

Il s'agit d'une conférence d'une heure offrant une introduction complète aux Grands Modèles de Langage (LLM). Elle couvre les concepts fondamentaux et le fonctionnement de ces puissantes technologies d'IA.

learning large language models

[1hr Talk] Intro to Large Language Models

DOCAndrej Karpathy (YouTube)·17/01/2023

Let's build GPT: from scratch, in code, spelled out.

Ce contenu propose un tutoriel détaillé sur la construction d'un modèle GPT à partir de zéro, expliquant chaque étape de l'implémentation dans le code. Il sert de guide pratique pour comprendre l'architecture et le fonctionnement des Grands Modèles de Langage.

GPT learning large language models AI development

Let's build GPT: from scratch, in code, spelled out.

DOCAndrej Karpathy (YouTube)·09/06/2024

Let's reproduce GPT-2 (124M)

Ce contenu propose un guide pour la reproduction du modèle GPT-2 (124M), détaillant les étapes nécessaires pour recréer cette architecture linguistique. Il s'agit d'un tutoriel pratique pour les passionnés et les développeurs d'IA.

learning GPT-2 machine learning large language models

ARTICLEThe AI Epiphany (YouTube)·03/07/2024

Best LLM? Qwen 2 LLM w/ author Junyang Lin

Ce contenu aborde Qwen 2, un grand modèle linguistique, potentiellement en examinant ses capacités ou en le comparant à d'autres LLMs, avec les perspectives de son auteur, Junyang Lin.

AI models Qwen 2 large language models LLM

Best LLM? Qwen 2 LLM w/ author Junyang Lin

ARTICLEThe AI Epiphany (YouTube)·16/09/2024

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

Ce contenu discute du projet ambitieux d'Imbue de former un modèle d'IA de 70 milliards de paramètres entièrement à partir de zéro. Il met en vedette Bowei, chef de l'infrastructure, qui donne un aperçu des défis et des processus impliqués dans une telle entreprise à grande échelle.

model training Imbue infrastructure large language models

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

ARTICLEDEV.to AI·11/04/2026

Best GirlfriendGPT Alternative in 2026: Why AI Angels Wins

L'article discute de l'évolution des applications d'IA compagnon et positionne AI Angels comme l'alternative supérieure à GirlfriendGPT en 2026. Il met en évidence la recherche des utilisateurs pour des expériences plus significatives, personnalisées et avec une meilleure confidentialité, désignant AI Angels comme le choix définitif pour la meilleure expérience de petite amie IA.

AI Angels AI girlfriends large language models AI companions

ARTICLEDEV.to AI·27/04/2026

The next phase of the Microsoft OpenAI partnership

La nouvelle phase du partenariat Microsoft OpenAI vise à intégrer les modèles avancés d'OpenAI, dont le GPT-4 de 1 billion de paramètres, dans les produits Microsoft tels qu'Azure, Dynamics et Office. Cette intégration permettra aux développeurs de créer et de déployer des applications basées sur l'IA sur la plateforme cloud.

GPT-4 AI integration cloud computing AI partnership

ARTICLEDEV.to AI·15/04/2026

Why Does AI Just... Make Stuff Up?

Cet article explore les raisons fondamentales pour lesquelles l'intelligence artificielle a tendance à générer des informations incorrectes ou fabriquées, souvent appelées "hallucinations". Il examine les mécanismes qui poussent les modèles d'IA à "inventer des choses" et discute des implications pour leur fiabilité et leur crédibilité.

AI hallucinations AI limitations AI reliability large language models

DOCfast.ai Blog·06/11/2025

A Guide to Solveit Features

Les grands modèles de langage facilitent remarquablement la génération de code, mais cela conduit souvent à un code que les développeurs ne comprennent pas. Ce manque de compréhension rend difficile la modification, le débogage ou l'ajout de fonctionnalités au code généré par l'IA.

code maintainability code generation large language models Software Engineering

ARTICLEDEV.to AI·13/04/2026

AI Agents vs RPA: Which Automation Technology Is Better?

Cet article compare les agents IA et la RPA, soulignant que la RPA automatise les tâches répétitives sur les interfaces utilisateur, tandis que les agents IA utilisent les LLM pour raisonner et s'adapter. Le choix dépend du besoin de répétition déterministe ou de prise de décision intelligente, de nombreuses organisations adoptant une approche hybride.

workflow automation large language models automation RPA

NEWSDEV.to AI·26/04/2026

DeepSeek-V4 Ported to MLX for Apple Silicon Inference

DeepSeek-V4 a été porté sur le framework MLX d'Apple, permettant au grand modèle linguistique de fonctionner sur les Mac Apple Silicon. Ce portage fonctionnel, réalisé par @Prince_Canuma, nécessite encore des optimisations pour améliorer les performances.

apple-silicon local inference MLX large language models

ARTICLEDEV.to AI·24/04/2026

Qwen3.6-Plus for Coding: When It Beats Qwen3.5-Plus

Le Qwen3.6-Plus surpasse le Qwen3.5-Plus pour les tâches de codage complexes et multi-étapes nécessitant l'inspection de la base de code, la planification et l'utilisation intégrée d'outils. Alors que le 3.5-Plus est bon pour les courts extraits, le 3.6-Plus excelle à maintenir le contexte dans les flux de travail impliquant des commandes de terminal, la recherche et la navigation.

AI models software development tool use large language models

ARTICLEDEV.to AI·08/04/2026

Understanding Tokens and Context Windows

Tokens são os blocos de construção fundamentais dos Large Language Models (LLMs), que preveem a próxima sequência de texto com base em unidades menores. Essa quebra do texto em tokens é essencial para o funcionamento dos sistemas de completação de chat.

LLMs Inteligência Artificial context windows large language models

ARTICLEDEV.to AI·11/04/2026

You Don’t Need “Prompt Engineering” to Talk to AI

Cet article soutient que le "Prompt Engineering" est surestimé pour les utilisateurs courants, affirmant qu'interagir avec les grands modèles linguistiques est aussi simple qu'une conversation. L'auteur, un étudiant en IA, propose une approche simple pour obtenir de bons résultats sans nécessiter de connaissances techniques avancées.

AI interaction User Guide prompt-engineering AI

ARTICLEDEV.to AI·13/04/2026

The Expensive Anxiety of AI

L'article analyse les ressources significatives et les coûts computationnels impliqués dans l'entraînement et le déploiement des modèles d'IA, en particulier les grands modèles de langage. Il discute du besoin de volumes massifs de données, d'opérations matricielles complexes et de matériel spécialisé comme les GPU et les TPU, ainsi que de techniques de traitement distribué et parallèle.

GPU computational costs large language models TPU

ARTICLEDEV.to AI·06/04/2026

I built a GitHub App that auto-writes PR descriptions — here's what happened in 8 days

O autor relata a criação e os resultados de um aplicativo GitHub baseado em IA, desenvolvido para gerar automaticamente descrições de pull requests, após 8 dias de uso.

GitHub productivity AI large language models

ARTICLEOpenAI Blog·10/04/2026

AI fundamentals

Ce guide pour débutants explique les fondamentaux de l'intelligence artificielle, détaillant ce qu'est l'IA et comment elle fonctionne. Il aborde également l'application des grands modèles de langage dans des outils comme ChatGPT.

ai-fundamentals beginner guide ChatGPT large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·28/04/2026

Duality of r/LocalLLaMA

Ce contenu est le titre d'une publication Reddit suggérant une discussion sur les aspects doubles ou contrastés de la communauté r/LocalLLaMA, axée sur les modèles de langage locaux.

AI Community Reddit large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

the state of LocalLLama

Este conteúdo apresenta uma análise sobre o estado atual do projeto LocalLLama. Ele explora os avanços e desafios que envolvem os Large Language Models locais.

open-source AI Local LLMs AI large language models

NEWSDEV.to AI·24/04/2026

DeepSeek V4 Rivoluziona l'IA con un Contesto da 1 Milione di Token e Ragionamento di Classe Mondiale

DeepSeek V4 révolutionne l'IA en introduisant une fenêtre de contexte d'un million de tokens et des capacités de raisonnement de classe mondiale. L'annonce détaille les points clés, avec une analyse plus approfondie disponible dans l'article complet.

DeepSeek AI models Context window Reasoning