large language models

262 items

RESEARCHarXiv CS.CL·8/4/2026

MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU

MegaTrain é um sistema focado em memória que permite o treinamento eficiente de modelos de linguagem grandes com mais de 100 bilhões de parâmetros em precisão total em uma única GPU. Ele armazena parâmetros na memória do host e utiliza otimizações como um motor de execução pipeline e templates de camada sem estado para superar gargalos de largura de banda e maximizar a utilização da GPU.

Single GPU Training Memory Optimization GPU Acceleration large language models

RESEARCHDEV.to AI·hace 18d

Hugging Face: New Research Highlights Value of Specialized AI Models

Hugging Face publicó una investigación de Dharma AI el 22 de mayo de 2026, destacando que los modelos de IA especializados pueden superar a los modelos más grandes y de propósito general en tareas específicas. El estudio sugiere un cambio estratégico en la adquisición de IA, priorizando el rendimiento y la eficiencia específicos de la tarea.

specialized AI models Hugging Face AI procurement large language models

RESEARCHarXiv CS.LG·hace 20d

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit es un nuevo marco de aprendizaje por refuerzo diseñado para mejorar el rendimiento de los grandes modelos de lenguaje en la interacción crítica científica. Aborda el problema de que los LLM abandonen soluciones correctas después de la crítica del usuario, centrándose en las transiciones de corrección entre turnos y categorizando comportamientos como la corrección, la adulación y la robustez.

reinforcement learning learning Scientific Reasoning large language models

RESEARCHarXiv CS.CL·hace 15d

Can AI Guess What You Know? Performance Comparison of Large Language Models for Human Domain Knowledge Estimation From Communication Logs

Esta investigación explora la capacidad de los Grandes Modelos de Lenguaje (LLMs) para inferir el conocimiento de dominio individual directamente de los registros de comunicación de Slack a largo plazo. Al evaluar siete modelos contra las calificaciones de habilidades autoinformadas, Gemini 2.5 Flash obtuvo el error más bajo, demostrando la viabilidad y los límites actuales del mapeo automatizado de la experiencia.

future-of-work expertise mapping domain knowledge organizational productivity

RESEARCHarXiv CS.CL·hace 5d

Computational conceptual history of scientific concepts: From early digital methods to LLMs

Este artículo sitúa los Large Language Models (LLMs) dentro de la historia de los enfoques computacionales para el análisis de conceptos en la historia, filosofía y sociología de la ciencia. Examina lo que los LLM añaden, los problemas que heredan y revisa estudios de caso recientes.

computational conceptual history digital methods concept analysis history of science

RESEARCHarXiv CS.LG·23/4/2026

Expert Upcycling: Shifting the Compute-Efficient Frontier of Mixture-of-Experts

«Expert Upcycling» introduce un método para expandir progresivamente la capacidad de Mixture-of-Experts (MoE) en grandes modelos de lenguaje durante el pre-entrenamiento continuo. Aumenta el número de expertos mediante duplicación y extensión del enrutador para una inicialización optimizada, con el fin de reducir los costos de entrenamiento y mantener el costo de inferencia por token.

Model Architecture training-optimization large language models

ARTICLEDEV.to AI·10/4/2026

AI21 Labs — Deep Dive

AI21 Labs é uma empresa israelense de IA e produto, um player significativo no espaço de IA generativa, competindo com gigantes como OpenAI. A empresa escalou seus modelos de linguagem de 1.5 bilhões para até 398 bilhões de parâmetros, oferecendo produtos como o assistente de escrita Wordtune e o modelo de contexto longo Jamba.

NLP AI products large language models AI21 Labs

ARTICLEDEV.to AI·2/5/2026

From prompt engineering to context engineering

El artículo propone un cambio crucial de la ingeniería de prompts a la ingeniería de contexto, argumentando que muchos fallos de IA provienen de la falta de información relevante, y no de una mala redacción. La ingeniería de contexto implica proporcionar deliberadamente a la IA datos cruciales, como instrucciones del sistema, documentación del proyecto y archivos fuente, antes de que actúe.

prompt-engineering Context Engineering large language models AI development

ARTICLEDEV.to AI·22/4/2026

A Looming Crisis of AI Generated Text

El artículo aborda la transición de la asistencia a la sustitución de texto por IA, impulsada por modelos como Mythos, y su profundo impacto en la alfabetización y la educación. El autor, que trabaja en aprendizaje automático y literatura, rechaza la idea de abandonar la escritura humana a pesar de la eficacia de la IA.

ethics education future-of-work large language models

ARTICLEDEV.to AI·hace 27d

VLAs are dead, long live World Action Models - a summary of Jim Fan's Robotics End Game talk

Jim Fan, del grupo de robótica de Nvidia, propone que la robótica está entrando en su "fase final" y seguirá la misma trayectoria de cuatro etapas que los grandes modelos de lenguaje. Él afirma que "la robótica está entrando en su juego final, y el plan de juego ya está escrito" por los LLMs.

future-of-AI AI large language models robotics

RESEARCHarXiv CS.AI·14/4/2026

Help Without Being Asked: A Deployed Proactive Agent System for On-Call Support with Continuous Self-Improvement

Este artículo presenta Vigil, un nuevo sistema de agente de IA proactivo diseñado para apoyar a los analistas humanos durante las interacciones de soporte en plataformas de servicios en la nube. A diferencia de los agentes reactivos, Vigil permanece involucrado durante todo el ciclo de vida de la resolución, aprendiendo de casos no resueltos y brindando asistencia continua para reducir la carga de trabajo humana.

On-Call Support proactive AI customer support large language models

RESEARCHarXiv CS.CL·14/4/2026

Generating High Quality Synthetic Data for Dutch Medical Conversations

Este artículo presenta un pipeline para generar diálogos médicos sintéticos en neerlandés utilizando un Large Language Model (LLM) ajustado para abordar la escasez de datos clínicos debido a restricciones de privacidad. Las evaluaciones revelaron una gran variedad léxica, pero un flujo de conversación guionizado y problemas de especificidad del dominio en la revisión cualitativa.

synthetic data Clinical Communication Dutch Language Medical NLP

RESEARCHarXiv CS.AI·hace 4d

What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

Este artículo analiza las estrategias de comunicación entre agentes en sistemas multiagente basados en LLMs, descubriendo que el lenguaje natural sin restricciones puede inflar el uso de tokens y afectar el rendimiento. Propone PACT (Protocolized Action-state Communication and Transmission), un método para optimizar la comunicación proyectando las salidas de los agentes en registros de estado-acción compactos.

Communication protocols efficiency Token usage multi-agent systems

NEWSDEV.to AI·18/4/2026

Large Language Letters 04/18/2026

El Claude Opus 4.7 de Anthropic demostró avances significativos en varios puntos de referencia como SWEBench Pro, GDP Val y capacidades de visión. El modelo superó a versiones anteriores y competidores en varias métricas, aunque observadores independientes notaron algunas regresiones.

AI models Benchmarking Anthropic large language models

ARTICLEDEV.to AI·23/4/2026

how to run qwen3.6-27b locally — the dense 27B that beats the 35B MoE on coding

Alibaba ha lanzado Qwen3.6-27B, un modelo denso de 27 mil millones de parámetros que supera a su versión MoE anterior en tareas de codificación. Este contenido detalla cómo ejecutar el modelo localmente usando Ollama, incluyendo comandos para diferentes cuantificaciones y requisitos de hardware.

Ollama Local AI model deployment large language models

RESEARCHarXiv CS.AI·7/4/2026

Evaluating Artificial Intelligence Through a Christian Understanding of Human Flourishing

Este conteúdo argumenta que o alinhamento de IA é um problema de formação, não apenas de segurança, pois LLMs atuam como instrumentos de catequese digital que moldam o entendimento humano. É introduzido o Flourishing AI Benchmark (FAI-C-ST) para avaliar modelos de IA contra uma compreensão cristã do florescimento humano, revelando que os sistemas atuais não são neutros, mas aderem a um Secularismo Processual.

AI alignment Avaliação de Modelos Filosofia da IA Ética em IA

RESEARCHarXiv CS.AI·7/4/2026

Toward Full Autonomous Laboratory Instrumentation Control with Large Language Models

Este trabalho explora o potencial de Grandes Modelos de Linguagem (LLMs), como o ChatGPT, e agentes de IA para automação e controle de instrumentação laboratorial. Demonstra-se como essas ferramentas reduzem barreiras de programação e podem evoluir para agentes autônomos capazes de operar equipamentos científicos e refinar estratégias de controle.

LLMs ChatGPT Instrumentation Control large language models

ARTICLEDEV.to AI·hace 21d

Mastering the Art of Conversation: Expert ChatGPT Tips and Tricks

Este artículo explora consejos y trucos de expertos para dominar ChatGPT, el revolucionario chatbot de IA de OpenAI. Analiza cómo comprender sus capacidades y limitaciones para desbloquear todo su potencial en conversaciones y diversas aplicaciones.

learning ChatGPT NLP AI

ARTICLEDEV.to AI·hace 5d

MiniMax M3: An Open-Weight Frontier Model You Can Self-Host

El MiniMax M3 es presentado como el primer modelo de frontera de código abierto que integra codificación avanzada, una ventana de contexto de 1M de tokens y multimodalidad nativa. Este modelo lidera la clasificación SWE-Bench Pro de peso abierto y permite el autoalojamiento, ofreciendo ventajas como la ausencia de tarifas de API por token.

multimodal AI self-hosting Open-weight AI AI benchmarking

RESEARCHarXiv CS.AI·20/4/2026

LLM Reasoning Is Latent, Not the Chain of Thought

Este documento postula que el razonamiento de los LLM debe estudiarse como formación de trayectoria de estado latente, en lugar de una cadena de pensamiento (CoT) superficial y fiel. Formaliza tres hipótesis concurrentes sobre el objeto principal del razonamiento, afectando la fidelidad, interpretabilidad y evaluaciones.

Chain-of-Thought interpretability AI Reasoning large language models