large language models

262 items

DOCAndrej Karpathy (YouTube)·23/11/2023

[1hr Talk] Intro to Large Language Models

Esta es una charla de una hora que ofrece una introducción completa a los Grandes Modelos de Lenguaje (LLMs). Cubre los conceptos fundamentales y el funcionamiento de estas potentes tecnologías de IA.

learning large language models

[1hr Talk] Intro to Large Language Models

DOCAndrej Karpathy (YouTube)·17/1/2023

Let's build GPT: from scratch, in code, spelled out.

Este contenido ofrece un tutorial detallado sobre cómo construir un modelo GPT desde cero, explicando cada paso de la implementación en código. Sirve como una guía práctica para comprender la arquitectura y funcionalidad de los Grandes Modelos de Lenguaje.

GPT learning large language models AI development

Let's build GPT: from scratch, in code, spelled out.

DOCAndrej Karpathy (YouTube)·9/6/2024

Let's reproduce GPT-2 (124M)

Este contenido ofrece una guía para reproducir el modelo GPT-2 (124M), detallando los pasos necesarios para recrear esta arquitectura de lenguaje. Sirve como un tutorial práctico para entusiastas y desarrolladores de IA.

learning GPT-2 machine learning large language models

ARTICLEThe AI Epiphany (YouTube)·3/7/2024

Best LLM? Qwen 2 LLM w/ author Junyang Lin

Este contenido discute Qwen 2, un modelo de lenguaje grande, posiblemente revisando sus capacidades o comparándolo con otros LLMs, presentando las perspectivas de su autor, Junyang Lin.

AI models Qwen 2 large language models LLM

Best LLM? Qwen 2 LLM w/ author Junyang Lin

ARTICLEThe AI Epiphany (YouTube)·16/9/2024

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

Este contenido trata sobre el ambicioso proyecto de Imbue de entrenar un modelo de IA de 70B completamente desde cero. Cuenta con Bowei, jefe de infraestructura, quien brinda información sobre los desafíos y procesos involucrados en una empresa de tan gran escala.

model training Imbue infrastructure large language models

Imbue - training a 70B model from scratch! (w/ Bowei - head of infra)

ARTICLEDEV.to AI·11/4/2026

Best GirlfriendGPT Alternative in 2026: Why AI Angels Wins

El artículo discute la evolución de las aplicaciones de IA compañera y posiciona a AI Angels como la alternativa superior a GirlfriendGPT en 2026. Destaca la búsqueda de los usuarios por experiencias más significativas, personalizadas y con mejor privacidad, señalando a AI Angels como la elección definitiva para la mejor experiencia de novia IA.

AI Angels AI girlfriends large language models AI companions

ARTICLEDEV.to AI·27/4/2026

The next phase of the Microsoft OpenAI partnership

La próxima fase de la asociación Microsoft OpenAI se centra en integrar los modelos avanzados de OpenAI, incluido el GPT-4 de 1 billón de parámetros, en productos de Microsoft como Azure, Dynamics y Office. Esta integración busca permitir a los desarrolladores construir y desplegar aplicaciones de IA en la plataforma en la nube.

GPT-4 AI integration cloud computing AI partnership

ARTICLEDEV.to AI·15/4/2026

Why Does AI Just... Make Stuff Up?

Este artículo explora las razones fundamentales por las cuales la inteligencia artificial tiende a generar información incorrecta o fabricada, a menudo denominada "alucinaciones". Profundiza en los mecanismos que hacen que los modelos de IA "inventen cosas" y discute las implicaciones para su fiabilidad y credibilidad.

AI hallucinations AI limitations AI reliability large language models

DOCfast.ai Blog·6/11/2025

A Guide to Solveit Features

Los grandes modelos de lenguaje facilitan la generación de código de manera notable, pero esto a menudo lleva a código que los desarrolladores no entienden. Esta falta de comprensión dificulta modificar, depurar o añadir funcionalidades al código generado por IA.

code maintainability code generation large language models Software Engineering

ARTICLEDEV.to AI·13/4/2026

AI Agents vs RPA: Which Automation Technology Is Better?

El artículo compara los agentes de IA y RPA, destacando que RPA automatiza tareas repetitivas en interfaces de usuario, mientras que los agentes de IA utilizan LLMs para razonar y adaptarse. La elección depende de la necesidad de repetición determinista o toma de decisiones inteligente, y muchas organizaciones adoptan un enfoque híbrido.

workflow automation large language models automation RPA

NEWSDEV.to AI·26/4/2026

DeepSeek-V4 Ported to MLX for Apple Silicon Inference

DeepSeek-V4 ha sido portado al framework MLX de Apple, permitiendo que el modelo de lenguaje grande se ejecute en Macs con Apple Silicon. Este puerto funcional, realizado por @Prince_Canuma, aún necesita optimización para un mejor rendimiento.

apple-silicon local inference MLX large language models

ARTICLEDEV.to AI·24/4/2026

Qwen3.6-Plus for Coding: When It Beats Qwen3.5-Plus

Qwen3.6-Plus supera a Qwen3.5-Plus en tareas de codificación complejas y multifásicas que requieren inspección del código, planificación y uso integrado de herramientas. Mientras que el 3.5-Plus es bueno para fragmentos cortos, el 3.6-Plus mantiene el contexto en flujos de trabajo que involucran comandos de terminal, búsqueda y navegación.

AI models software development tool use large language models

ARTICLEDEV.to AI·8/4/2026

Understanding Tokens and Context Windows

Tokens são os blocos de construção fundamentais dos Large Language Models (LLMs), que preveem a próxima sequência de texto com base em unidades menores. Essa quebra do texto em tokens é essencial para o funcionamento dos sistemas de completação de chat.

LLMs Inteligência Artificial context windows large language models

ARTICLEDEV.to AI·11/4/2026

You Don’t Need “Prompt Engineering” to Talk to AI

Este artículo argumenta que la "Ingeniería de Prompts" está sobrevalorada para usuarios comunes, afirmando que interactuar con Modelos de Lenguaje Grandes es tan simple como tener una conversación. El autor, un estudiante de IA, propone un enfoque sencillo para obtener buenos resultados sin necesidad de conocimientos técnicos avanzados.

AI interaction User Guide prompt-engineering AI

ARTICLEDEV.to AI·13/4/2026

The Expensive Anxiety of AI

El artículo analiza los importantes recursos y costes computacionales implicados en el entrenamiento y despliegue de modelos de IA, especialmente los grandes modelos de lenguaje. Discute la necesidad de grandes volúmenes de datos, operaciones de matriz complejas y hardware especializado como GPUs y TPUs, así como técnicas de procesamiento distribuido y paralelo.

GPU computational costs large language models TPU

ARTICLEDEV.to AI·6/4/2026

I built a GitHub App that auto-writes PR descriptions — here's what happened in 8 days

O autor relata a criação e os resultados de um aplicativo GitHub baseado em IA, desenvolvido para gerar automaticamente descrições de pull requests, após 8 dias de uso.

GitHub productivity AI large language models

ARTICLEOpenAI Blog·10/4/2026

AI fundamentals

Esta guía para principiantes explica los fundamentos de la inteligencia artificial, detallando qué es la IA y cómo funciona. También cubre la aplicación de grandes modelos de lenguaje en herramientas como ChatGPT.

ai-fundamentals beginner guide ChatGPT large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·28/4/2026

Duality of r/LocalLLaMA

Este contenido es el título de una publicación de Reddit que sugiere una discusión sobre los aspectos duales o contrastantes de la comunidad r/LocalLLaMA, centrada en modelos de lenguaje locales.

AI Community Reddit large language models

ARTICLE↑ trendingReddit r/LocalLLaMA·10/4/2026

the state of LocalLLama

Este conteúdo apresenta uma análise sobre o estado atual do projeto LocalLLama. Ele explora os avanços e desafios que envolvem os Large Language Models locais.

open-source AI Local LLMs AI large language models

NEWSDEV.to AI·24/4/2026

DeepSeek V4 Rivoluziona l'IA con un Contesto da 1 Milione di Token e Ragionamento di Classe Mondiale

DeepSeek V4 está revolucionando la IA al introducir un contexto de 1 millón de tokens y capacidades de razonamiento de clase mundial. El anuncio detalla los puntos clave, con un análisis más profundo disponible en el artículo completo.

DeepSeek AI models Context window Reasoning