← heapsort-ai

Scientific Discovery

18 items

RESEARCHarXiv CS.CL·vor 14T

Multi-Persona Debate System for Automated Scientific Hypothesis Generation

Das Multi-Persona Debate System (MPDS) ist ein literaturgestütztes Framework zur automatisierten Generierung wissenschaftlicher Hypothesen, das die Herausforderung der Synthese fragmentierten Wissens, insbesondere in der Batteriematerialforschung, adressiert. Es kombiniert Literaturrecherche, Reasoning großer Sprachmodelle und Multi-Agenten-Debatten, um Verhandlungen zwischen Personas bei gleichzeitiger Sicherstellung der Nachvollziehbarkeit der Evidenz zu ermöglichen.

32
RESEARCHarXiv CS.CL·4/14/2026

GIANTS: Generative Insight Anticipation from Scientific Literature

Dieses Papier stellt „Insight Anticipation“ vor, eine neuartige Aufgabe, bei der Sprachmodelle die Kernaussage eines zukünftigen wissenschaftlichen Artikels aus seinen grundlegenden Vorgängern vorhersagen. Zur Evaluierung dieser Fähigkeit entwickelten die Autoren GiantsBench, einen Benchmark mit 17.000 Beispielen, und stellen GIANTS-4B vor, ein mit Reinforcement Learning trainiertes Sprachmodell.

30
RESEARCHarXiv CS.CL·4/16/2026

Mathematical Reasoning Enhanced LLM for Formula Derivation: A Case Study on Fiber NLI Modellin

Diese Forschung stellt einen mathematisch begründeten generativen KI-Ansatz zur Ableitung von Formeln für die optische Kommunikation vor, insbesondere zur Modellierung nichtlinearer Interferenzen in Glasfasern. Durch die Anleitung eines LLM mit strukturierten Prompts rekonstruierte die Studie erfolgreich bekannte Ausdrücke und leitete eine neuartige Annäherung ab, die sowohl physikalische Konsistenz als auch praktische Genauigkeit zeigte.

29
RESEARCHarXiv CS.AI·4/14/2026

LABBench2: An Improved Benchmark for AI Systems Performing Biology Research

LABBench2 wird als verbesserter Benchmark zur Bewertung von KI-Systemen vorgestellt, die Biologieforschung betreiben, und ist eine Weiterentwicklung des ursprünglichen LAB-Bench. Er zielt darauf ab, reale Fähigkeiten in nützlichen wissenschaftlichen Aufgaben zu messen, über grundlegendes Wissen und Schlussfolgerungen hinauszugehen, und umfasst fast 1.900 Aufgaben.

28
NEWSDEV.to AI·4/17/2026

GPT‑Rosalind for life sciences research

GPT-Rosalind, ein neues OpenAI-Tool, basierend auf GPT-4 und auf wissenschaftliche Daten feinabgestimmt, wurde eingeführt, um die Forschung in den Biowissenschaften zu beschleunigen. Es begegnet dem Datenengpass durch die Optimierung von Hypothesengenerierung, Literaturanalyse und experimentellem Design, mit dem Potenzial, die Kosten und Zeitpläne der Arzneimittelentwicklung zu reduzieren.

28
RESEARCHarXiv CS.AI·vor 22T

NIMO Controller: a self-driving laboratory orchestrator based on the Model Context Protocol

Dieser Artikel stellt den NIMO Controller vor, einen Orchestrator für selbstfahrende Labore, der auf dem Model Context Protocol (MCP) basiert, um die Zugänglichkeit zu verbessern und die wissenschaftliche Entdeckung zu beschleunigen. Er bietet eine vereinheitlichte Schnittstelle für menschliche Benutzer und KI-Agenten, die das Design experimenteller Workflows ohne Programmierung ermöglicht.

28
NEWSDEV.to AI·vor 19T

Today's AI & Tech Digest: Lightweight Models, Scientific Breakthroughs, and the Provenance Battle (2026-05-21)

Das heutige KI- und Tech-Digest hebt eine Verschiebung hin zu optimierten, agentischen KI-Modellen sowie einen tiefgreifenden Meilenstein in der KI-gesteuerten wissenschaftlichen Entdeckung hervor. Google hat Gemini 3.5 Flash für schnelle Inferenz auf den Markt gebracht, während ein OpenAI-Modell eine langjährige mathematische Vermutung widerlegt hat.

27
RESEARCHarXiv CS.AI·vor 24T

Sheaf-Theoretic Transport and Obstruction for Detecting Scientific Theory Shift in AI Agents

Dieses Papier führt einen endlichen Garbentheorie-basierten Rahmen zur Erkennung von wissenschaftlichem Theoriewechsel bei KI-Agenten ein. Es konzentriert sich darauf, zu identifizieren, wann ein bestehendes Repräsentationsframework aufgrund einer lokal-globalen Obstruktion erweitert werden muss, anstatt nur deformiert zu werden.

27
RESEARCHarXiv CS.LG·vor 14T

LLM-AutoSciLab: Closed-Loop Scientific Discovery via Active Experimentation with LLMs

LLM-AutoSciLab schlägt ein geschlossenes Kreislaufsystem für die wissenschaftliche Entdeckung vor, das über statische Schlussfolgerungen hinausgeht, indem es die Hypothesengenerierung aktiv mit der Experimentauswahl und Mechanismusverfeinerung koppelt. Es schlägt iterativ plausible Hypothesen vor, wählt informative Experimente zur Unterscheidung oder Verfeinerung aus und aktualisiert seinen Zustand anhand der resultierenden Beweise.

27
RESEARCHarXiv CS.AI·4/8/2026

PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing

PaperOrchestra é um framework multiagente para escrita automatizada de artigos de pesquisa em IA, transformando materiais brutos em manuscritos LaTeX com síntese de literatura e visuais. Avaliado com o novo benchmark PaperWritingBench, ele supera significativamente as linhas de base autônomas em avaliações humanas.

27
RESEARCHarXiv CS.AI·vor 19T

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

AgentCo-op ist ein abrufbasierter Synthese-Framework, der interoperable Multi-Agenten-Workflows aus wiederverwendbaren Fähigkeiten, Werkzeugen und externen Agenten zusammensetzt. Es wendet eine begrenzte, selbstgeführte lokale Reparatur auf beteiligte Komponenten bei Ausführungsfehlern an und wurde in Genomik-Fallstudien zur Koordination spezialisierter Agenten demonstriert.

27
ARTICLEMIT Tech Review AI·4/21/2026

Artificial scientists

KI-Unternehmen rechtfertigen ihre Existenz mit der Möglichkeit KI-gestützter wissenschaftlicher Entdeckungen, wie der Heilung von Krebs oder der Lösung des Klimawandels. Große Sprachmodelle (LLMs) unterstützen Wissenschaftler bereits auf vielfältige Weise.

23