← heapsort-ai

large language models

262 items

RESEARCHarXiv CS.CL·4/8/2026

MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU

MegaTrain é um sistema focado em memória que permite o treinamento eficiente de modelos de linguagem grandes com mais de 100 bilhões de parâmetros em precisão total em uma única GPU. Ele armazena parâmetros na memória do host e utiliza otimizações como um motor de execução pipeline e templates de camada sem estado para superar gargalos de largura de banda e maximizar a utilização da GPU.

29
RESEARCHarXiv CS.LG·20d ago

ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning

ReCrit is a new reinforcement learning framework designed to improve large language models' performance in scientific critic interaction. It addresses the issue of LLMs abandoning correct solutions after user criticism by focusing on inter-turn correctness transitions and categorizing behaviors like correction, sycophancy, and robustness.

29
RESEARCHarXiv CS.CL·15d ago

Can AI Guess What You Know? Performance Comparison of Large Language Models for Human Domain Knowledge Estimation From Communication Logs

This research investigates the ability of Large Language Models (LLMs) to infer individual domain knowledge directly from long-term Slack communication logs. Evaluating seven models against self-reported skill ratings, Gemini 2.5 Flash achieved the lowest error, demonstrating the feasibility and current limits of automated expertise mapping.

28
ARTICLEDEV.to AI·4/10/2026

AI21 Labs — Deep Dive

AI21 Labs é uma empresa israelense de IA e produto, um player significativo no espaço de IA generativa, competindo com gigantes como OpenAI. A empresa escalou seus modelos de linguagem de 1.5 bilhões para até 398 bilhões de parâmetros, oferecendo produtos como o assistente de escrita Wordtune e o modelo de contexto longo Jamba.

28
RESEARCHarXiv CS.AI·4/14/2026

Help Without Being Asked: A Deployed Proactive Agent System for On-Call Support with Continuous Self-Improvement

This paper introduces Vigil, a novel proactive AI agent system designed to support human analysts during on-call interactions in large-scale cloud service platforms. Unlike reactive agents, Vigil remains engaged throughout the entire resolution life-cycle, learning from unresolved cases and providing continuous assistance to reduce human workload.

28
RESEARCHarXiv CS.AI·4d ago

What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

This paper analyzes inter-agent communication strategies in multi-agent systems built on large language models, finding that unconstrained natural language can inflate token usage and affect performance. It proposes PACT (Protocolized Action-state Communication and Transmission), a method to optimize communication by projecting raw agent outputs into compact action-state records.

28
RESEARCHarXiv CS.AI·4/7/2026

Evaluating Artificial Intelligence Through a Christian Understanding of Human Flourishing

Este conteúdo argumenta que o alinhamento de IA é um problema de formação, não apenas de segurança, pois LLMs atuam como instrumentos de catequese digital que moldam o entendimento humano. É introduzido o Flourishing AI Benchmark (FAI-C-ST) para avaliar modelos de IA contra uma compreensão cristã do florescimento humano, revelando que os sistemas atuais não são neutros, mas aderem a um Secularismo Processual.

28
RESEARCHarXiv CS.AI·4/7/2026

Toward Full Autonomous Laboratory Instrumentation Control with Large Language Models

Este trabalho explora o potencial de Grandes Modelos de Linguagem (LLMs), como o ChatGPT, e agentes de IA para automação e controle de instrumentação laboratorial. Demonstra-se como essas ferramentas reduzem barreiras de programação e podem evoluir para agentes autônomos capazes de operar equipamentos científicos e refinar estratégias de controle.

28