modelos de linguagem

8 items

ARTICLE↑ trendingReddit r/MachineLearning·12/04/2026

LLMs learn backwards, and the scaling hypothesis is bounded. [D]

Ce contenu discute la perspective selon laquelle les Large Language Models (LLMs) apprennent à l'envers et que l'hypothèse de mise à l'échelle a des limites inhérentes.

LLMs deep learning scaling hypothesis modelos de linguagem

ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

RESEARCHarXiv CS.CL·07/04/2026

Rethinking Token Prediction: Tree-Structured Diffusion Language Model

Este trabalho propõe um modelo de linguagem de difusão com estrutura de árvore para otimizar o treinamento e reduzir o uso de parâmetros e memória em modelos de difusão discretos. Ele substitui a previsão de vocabulário completo pela exploração da estrutura inerente dos tokens através de uma árvore de vocabulário pré-construída, utilizando estados latentes intermediários.

previsão de tokens árvore de vocabulário difusão discreta arquitetura de IA

ARTICLEQwen Blog·26/01/2025

Qwen2.5-1M: Deploy Your Own Qwen with Context Length up to 1M Tokens

Este conteúdo anuncia o lançamento dos modelos open-source Qwen2.5-1M (7B e 14B), que agora suportam um comprimento de contexto de até um milhão de tokens. Esta liberação expande as capacidades dos modelos Qwen para lidar com contextos extensos, seguindo a atualização da versão Turbo.

Contexto de 1M Open Source Inteligência Artificial modelos de linguagem

NEWSQwen Blog·22/07/2025

Qwen3-Coder: Agentic Coding in the World

Qwen3-Coder é um novo modelo de código agêntico, com destaque para a variante 480B-A35B-Instruct, que oferece 480 bilhões de parâmetros e suporta contextos de até 1 milhão de tokens. Ele estabelece novos recordes de desempenho em codificação agêntica, uso de navegador e ferramentas, comparável ao Claude Sonnet 4.

programação Agentes de IA IA Qwen3-Coder

NEWSQwen Blog·22/09/2025

Qwen3Guard: Real-time Safety for Your Token Stream

Qwen3Guard é o primeiro modelo de proteção de segurança da família Qwen, projetado para garantir interações de IA responsáveis. Baseado nos modelos Qwen3, ele oferece detecção precisa de segurança em prompts e respostas, com níveis de risco e classificações para moderação, alcançando desempenho de ponta em benchmarks multilíngues.

Moderação de Conteúdo IA Responsável modelos de linguagem Qwen

ARTICLEQwen Blog·28/01/2025

Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model

O conteúdo explora a importância da escalabilidade contínua de dados e modelos (densos ou Mixture-of-Expert) para aprimorar a inteligência artificial, destacando a experiência limitada da comunidade na área. Menciona que detalhes críticos de escalabilidade foram recentemente divulgados pelo DeepSeek V3 e que o Qwen2 está em desenvolvimento.

IA modelos de linguagem MoE

ARTICLEDEV.to AI·12/04/2026

本地运行AI模型完整指南：用Ollama在电脑上跑GPT-4级模型

Cet article est un guide complet sur l'utilisation d'Ollama pour exécuter des grands modèles linguistiques (LLM) localement, gratuitement et de manière privée. Il détaille le processus de déploiement d'assistants IA puissants sur votre ordinateur personnel, y compris les exigences matérielles et les commandes de base.

IA Local Ollama privacidade código aberto