← heapsort-ai

Llama 3

8 items

ARTICLE↑ trendingReddit r/MachineLearning·15/04/2026

Built GPT-2, Llama 3, and DeepSeek from scratch in PyTorch - open source code + book [p]

Un ingénieur senior a passé la dernière année à implémenter cinq architectures LLM à partir de zéro en PyTorch, notamment GPT-2, Llama 3 et DeepSeek. Le projet a abouti à du code open source et à un livre détaillé documentant le processus, expliquant des concepts avancés comme le cache KV, MoE et la quantification FP8.

44
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled Local AI Agent with Whisper, LLaMA 3 and Streamlit

EchoMemo est un agent d'IA local à commande vocale fonctionnant entièrement hors ligne, utilisant des modèles comme Whisper et Ollama pour convertir la parole en texte et comprendre l'intention de l'utilisateur. Ce projet démontre une solution pour la confidentialité, le coût, la dépendance et la latence, offrant une interface utilisateur web propre sans API ni internet après la configuration initiale.

31
DOCDEV.to AI·10/05/2026

How to Deploy Llama 3.2 11B with GGUF Quantization on a $5/Month DigitalOcean Droplet: Production Inference Without GPU Costs

Cet article explique comment déployer le modèle Llama 3.2 11B avec la quantification GGUF sur un Droplet DigitalOcean à faible coût pour l'inférence en production. Il met en évidence des économies considérables par rapport aux API d'IA payantes, tout en maintenant de bonnes performances sur les CPU.

27
ARTICLEThe AI Epiphany (YouTube)·31/07/2024

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)

Ce contenu propose une analyse approfondie de LLaMA 3, le modèle de langage étendu avancé de Meta. Il présente les éclairages de Thomas Scialom, une figure clé de Meta, offrant une exploration détaillée de son architecture, de ses capacités et de ses applications potentielles.

LLaMA 3 Deep Dive! (Thomas Scialom - Meta)
27