← heapsort-ai

Scientific Discovery

18 items

RESEARCHarXiv CS.CL·il y a 14j

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

Le Système de Débat Multi-Persona (MPDS) est un cadre basé sur la littérature pour la génération automatisée d'hypothèses scientifiques, visant à surmonter le défi de synthétiser des connaissances fragmentées, notamment dans la recherche sur les matériaux de batterie. Il intègre la récupération de littérature, le raisonnement de grands modèles linguistiques et le débat multi-agents, permettant la négociation entre personas tout en préservant la traçabilité des preuves.

32
RESEARCHarXiv CS.CL·14/04/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Cet article présente la tâche d'« anticipation d'insights », où les modèles de langage prédisent l'idée centrale d'un futur article scientifique à partir de ses prédécesseurs. Pour ce faire, les auteurs ont développé GiantsBench, un benchmark de 17 000 exemples, et présentent GIANTS-4B, un LM entraîné par apprentissage par renforcement.

30
RESEARCHarXiv CS.CL·16/04/2026

Mathematical Reasoning Enhanced LLM for Formula Derivation: A Case Study on Fiber NLI Modellin

Cette recherche présente une approche d'IA générative améliorée par le raisonnement mathématique pour la dérivation de formules de communication optique, en se concentrant sur la modélisation des interférences non linéaires de la fibre. L'étude a réussi à reconstruire des expressions connues et à dériver une nouvelle approximation à l'aide d'un LLM, prouvant la cohérence physique et la précision pratique.

29
RESEARCHarXiv CS.AI·14/04/2026

LABBench2: An Improved Benchmark for AI Systems Performing Biology Research

LABBench2 est présenté comme un benchmark amélioré pour évaluer les systèmes d'IA effectuant de la recherche en biologie, évoluant du LAB-Bench original. Il vise à mesurer les capacités du monde réel dans des tâches scientifiques utiles, allant au-delà des connaissances et du raisonnement de base, et comprend près de 1 900 tâches.

28
NEWSDEV.to AI·17/04/2026

GPT‑Rosalind for life sciences research

GPT-Rosalind, un nouvel outil d'OpenAI basé sur GPT-4 et entraîné sur des données scientifiques, a été lancé pour accélérer la recherche en sciences de la vie. Il s'attaque au goulot d'étranglement des données en optimisant la génération d'hypothèses, l'analyse de la littérature et la conception expérimentale, avec le potentiel de réduire les coûts et les délais de développement de médicaments.

28
RESEARCHarXiv CS.AI·il y a 22j

NIMO Controller: a self-driving laboratory orchestrator based on the Model Context Protocol

Cet article présente le NIMO Controller, un orchestrateur de laboratoires autonomes basé sur le protocole de contexte de modèle (MCP), visant à améliorer l'accessibilité et à accélérer la découverte scientifique. Il offre une interface unifiée pour les utilisateurs humains et les agents d'IA, facilitant la conception de flux de travail expérimentaux sans codage.

28
NEWSDEV.to AI·il y a 19j

Today's AI & Tech Digest: Lightweight Models, Scientific Breakthroughs, and the Provenance Battle (2026-05-21)

Le résumé quotidien d'aujourd'hui sur l'IA et la technologie met en lumière un virage vers des modèles d'IA optimisés et agiles, ainsi qu'une étape majeure dans la découverte scientifique pilotée par l'IA. Google a lancé Gemini 3.5 Flash pour une inférence à haute vitesse, et un modèle d'OpenAI a réfuté une conjecture mathématique de longue date.

27
RESEARCHarXiv CS.AI·il y a 24j

Sheaf-Theoretic Transport and Obstruction for Detecting Scientific Theory Shift in AI Agents

Cet article présente un cadre fini basé sur la théorie des faisceaux pour détecter le changement de théorie scientifique chez les agents d'IA. Il se concentre sur l'identification du moment où un cadre représentationnel existant nécessite une extension en raison d'une obstruction locale-globale, plutôt qu'une simple déformation.

27
RESEARCHarXiv CS.LG·il y a 14j

LLM-AutoSciLab: Closed-Loop Scientific Discovery via Active Experimentation with LLMs

LLM-AutoSciLab propose un cadre en boucle fermée pour la découverte scientifique, allant au-delà de l'inférence statique en couplant activement la génération d'hypothèses avec la sélection d'expériences et le raffinement des mécanismes. Il suggère itérativement des hypothèses, choisit des expériences informatives pour les distinguer ou les affiner, et met à jour son état en utilisant les preuves résultantes.

27
RESEARCHarXiv CS.AI·08/04/2026

PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing

PaperOrchestra é um framework multiagente para escrita automatizada de artigos de pesquisa em IA, transformando materiais brutos em manuscritos LaTeX com síntese de literatura e visuais. Avaliado com o novo benchmark PaperWritingBench, ele supera significativamente as linhas de base autônomas em avaliações humanas.

27
RESEARCHarXiv CS.AI·il y a 19j

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op est un cadre de synthèse basé sur la récupération qui compose des flux de travail multi-agents interopérables à partir de compétences, d'outils et d'agents externes. Il applique une réparation locale auto-guidée aux composants impliqués en cas d'échec d'exécution et a été démontré dans des études de cas en génomique pour coordonner des agents spécialisés.

27
ARTICLEMIT Tech Review AI·21/04/2026

Artificial scientists

Les entreprises d'IA justifient leur existence par la promesse de découvertes scientifiques rendues possibles par l'IA, comme la guérison du cancer ou la résolution du changement climatique. Les grands modèles linguistiques (LLM) sont déjà utiles aux scientifiques de diverses manières.

23