modelos de linguagem

8 items

ARTICLE↑ trendingReddit r/MachineLearning·12/4/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Este contenido discute la perspectiva de que los Large Language Models (LLMs) aprenden de manera inversa y que la hipótesis de escalabilidad tiene límites inherentes.

LLMs deep learning scaling hypothesis modelos de linguagem

ARTICLE↑ trendingReddit r/LocalLLaMA·9/4/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

RESEARCHarXiv CS.CL·7/4/2026

Rethinking Token Prediction: Tree-Structured Diffusion Language Model

Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.

previsão de tokens árvore de vocabulário difusão discreta arquitetura de IA

ARTICLEQwen Blog·26/1/2025

Qwen2.5-1M: Deploy Your Own Qwen with Context Length up to 1M Tokens

Este conteúdo anuncia o lançamento dos modelos open-source Qwen2.5-1M (7B e 14B), que agora suportam um comprimento de contexto de até um milhão de tokens. Esta liberação expande as capacidades dos modelos Qwen para lidar com contextos extensos, seguindo a atualização da versão Turbo.

Contexto de 1M Open Source Inteligência Artificial modelos de linguagem

NEWSQwen Blog·22/7/2025

Qwen3-Coder: Agentic Coding in the World

Qwen3-Coder é um novo modelo de código agêntico, com destaque para a variante 480B-A35B-Instruct, que oferece 480 bilhões de parâmetros e suporta contextos de até 1 milhão de tokens. Ele estabelece novos recordes de desempenho em codificação agêntica, uso de navegador e ferramentas, comparável ao Claude Sonnet 4.

programação Agentes de IA IA Qwen3-Coder

NEWSQwen Blog·22/9/2025

Qwen3Guard: Real-time Safety for Your Token Stream

Qwen3Guard é o primeiro modelo de proteção de segurança da família Qwen, projetado para garantir interações de IA responsáveis. Baseado nos modelos Qwen3, ele oferece detecção precisa de segurança em prompts e respostas, com níveis de risco e classificações para moderação, alcançando desempenho de ponta em benchmarks multilíngues.

Moderação de Conteúdo IA Responsável modelos de linguagem Qwen

ARTICLEQwen Blog·28/1/2025

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

O conteúdo explora a importância da escalabilidade contínua de dados e modelos (densos ou Mixture-of-Expert) para aprimorar a inteligência artificial, destacando a experiência limitada da comunidade na área. Menciona que detalhes críticos de escalabilidade foram recentemente divulgados pelo DeepSeek V3 e que o Qwen2 está em desenvolvimento.

IA modelos de linguagem MoE

ARTICLEDEV.to AI·12/4/2026

本地运行AI模型完整指南：用Ollama在电脑上跑GPT-4级模型

Este artículo es una guía completa sobre cómo usar Ollama para ejecutar modelos de lenguaje grandes (LLMs) localmente, de forma gratuita y privada. Detalla el proceso de implementación de potentes asistentes de IA en su ordenador personal, incluyendo requisitos de hardware y comandos básicos.

IA Local Ollama privacidade código aberto