← heapsort-ai

AI frameworks

35 items

RESEARCHarXiv CS.AI·il y a 23j

SDOF: Taming the Alignment Tax in Multi-Agent Orchestration with State-Constrained Dispatch

Cet article présente SDOF, un framework qui traite l'exécution multi-agent comme une machine à états contrainte pour faire respecter les règles des processus métier. Il intègre un routeur d'intention entraîné par RLHF et un répartiteur conscient de l'état, surpassant GPT-4o sur un benchmark de routage adversarial dans un système de recrutement.

27
DOCDEV.to AI·il y a 15j

로컬 LLM 셋업 가이드 (v33)

Ce guide pratique détaille le processus de configuration des Grands Modèles Linguistiques (LLMs) localement, visant les économies de coûts et la confidentialité des données. Il couvre les exigences matérielles, compare des frameworks comme llama.cpp et Ollama, et fournit un processus d'installation étape par étape.

27
ARTICLEO'Reilly Radar·06/05/2026

Eating My Own Dog Food: How I Used the Framework to Write the Post About the Framework

Cet article traite de l'application d'un cadre alignant l'autonomie de l'IA avec le risque commercial et la différenciation concurrentielle. L'auteur a utilisé les contrôles de coûts d'AI Gateway comme exemple pour illustrer comment une seule fonctionnalité peut toucher divers quadrants stratégiques.

Eating My Own Dog Food: How I Used the Framework to Write the Post About the Framework
27
RESEARCHarXiv CS.AI·21/04/2026

Agentic Frameworks for Reasoning Tasks: An Empirical Study

Cette étude empirique évalue 22 frameworks d'agents sur trois benchmarks de raisonnement (BBH, GSM8K, ARC) pour comparer leurs performances, efficacité et pertinence pratique. Les résultats montrent que 19 frameworks ont complété toutes les tâches, avec 12 démontrant des performances stables à 74,6-75,9% de précision, un temps d'exécution de 4-6 secondes et un coût de 0,14-0,18 centimes par tâche.

27
RESEARCHarXiv CS.LG·06/05/2026

An End-to-End Framework for Building Large Language Models for Software Operations

Cet article présente OpsLLM, un cadre de bout en bout pour la construction de grands modèles linguistiques (LLM) spécifiques aux opérations logicielles. Il aborde les défis tels que les données de faible qualité et les connaissances fragmentées, détaillant un flux de travail comprenant la curation des données, le réglage fin supervisé et un modèle de récompense de processus de domaine.

27
RESEARCHarXiv CS.AI·08/04/2026

MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems

Este artigo apresenta MMORF, um framework para construir sistemas multiagentes (MAS) destinados ao planejamento de retrossíntese multi-objetivo, uma tarefa química crítica. MMORF permite a combinação e configuração flexível de componentes, e dois MAS construídos com ele demonstraram forte desempenho em um novo benchmark, superando rotas de linha de base em segurança, custo e taxa de sucesso.

27
RESEARCHarXiv CS.AI·07/04/2026

TABQAWORLD: Optimizing Multimodal Reasoning for Multi-Turn Table Question Answering

TABQAWORLD é um novo framework para otimizar o raciocínio multimodal em perguntas e respostas sobre tabelas multi-turn. Ele aborda erros de representação e altos custos de inferência ao empregar uma política de seleção multimodal que alterna dinamicamente entre representações visuais e textuais para maximizar a confiabilidade do estado da tabela.

27
ARTICLEDEV.to AI·14/04/2026

Multi-Agent AI Systems Explained: Architecture and Use Cases

Les systèmes d'IA multi-agents impliquent des agents IA spécialisés collaborant pour gérer des tâches complexes, en divisant le travail entre des rôles comme la recherche ou la révision de code. Ils sont utilisés en production pour divers flux de travail, y compris le développement logiciel et la création de contenu, avec une orchestration fournie par des frameworks tels qu'OpenClaw et CrewAI.

23