scientific research

12 items

RESEARCHarXiv CS.AI·il y a 22h

A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline

Cette recherche évalue empiriquement des agents de codage d'IA à usage général sur un pipeline de découverte de données en neurosciences, évaluant leur capacité à automatiser des tâches scientifiques complexes. Elle constate que les agents peuvent résoudre des étapes individuelles du pipeline mais rencontrent des difficultés avec le jugement scientifique en l'absence de critères d'itération prédéfinis.

Benchmarking Neuroscience automation AI agents

RESEARCH↑ trendingReddit r/LocalLLaMA·il y a 25j

internlm/Intern-S2-Preview · Hugging Face

Intern-S2-Preview est un modèle de fondation multimodal scientifique efficace de 35B qui atteint des performances comparables à celles de modèles à l'échelle du billion en explorant la mise à l'échelle des tâches et l'entraînement en chaîne complète. Il excelle dans des centaines de tâches scientifiques professionnelles tout en conservant de solides capacités de raisonnement général, de compréhension multimodale et d'agent.

AI models multimodal AI model training Foundation Models

internlm/Intern-S2-Preview · Hugging Face

RESEARCHarXiv CS.AI·07/04/2026

Toward Full Autonomous Laboratory Instrumentation Control with Large Language Models

Este trabalho explora o potencial de Grandes Modelos de Linguagem (LLMs), como o ChatGPT, e agentes de IA para automação e controle de instrumentação laboratorial. Demonstra-se como essas ferramentas reduzem barreiras de programação e podem evoluir para agentes autônomos capazes de operar equipamentos científicos e refinar estratégias de controle.

LLMs ChatGPT Instrumentation Control large language models

ARTICLEDEV.to AI·il y a 19j

Towards an AI co-scientist

Ce contenu explore l'évolution de l'intelligence artificielle pour agir comme une "co-scientifique", assistant les chercheurs à diverses étapes du processus scientifique. Il discute du potentiel de l'IA pour accélérer les découvertes et transformer la méthodologie de recherche.

future-of-AI Scientific Discovery human-AI collaboration AI in science

RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.AI·16/04/2026

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Ce travail présente SciFi, un cadre agentique sûr, léger et convivial pour l'exécution autonome de tâches scientifiques. Il combine un environnement isolé, une boucle d'agent à trois couches et un mécanisme d'auto-évaluation pour assurer un fonctionnement fiable, tirant parti des LLM pour automatiser les charges de travail scientifiques routinières et libérer les chercheurs pour des activités créatives.

LLMs Workflow Agentic AI automation

RESEARCHarXiv CS.AI·22/04/2026

AI scientists produce results without reasoning scientifically

Les systèmes basés sur les LLM mènent de la recherche scientifique autonome, mais leur raisonnement ne respecte pas les normes épistémiques, ignorant les preuves dans 68 % des cas. Une étude sur 25 000 exécutions a montré que les modèles de base déterminent la performance et le comportement de l'agent.

LLMs AI Reasoning AI agents scientific research

NEWSGoogle DeepMind Blog·27/04/2026

Announcing our partnership with the Republic of Korea

Google DeepMind et la République de Corée annoncent un partenariat pour accélérer les découvertes scientifiques. Cette collaboration vise à utiliser des modèles d'IA de pointe pour stimuler des avancées significatives.

deep learning government-collaboration Partnerships artificial intelligence

Announcing our partnership with the Republic of Korea

DOCDEV.to AI·il y a 20j

35 ChatGPT Prompts for Environmental Scientists: Accelerate Research, Reporting, and Stakeholder Communication

Ce contenu propose 35 invites ChatGPT conçues pour aider les scientifiques de l'environnement à rationaliser leurs recherches, leurs rapports et leur communication avec les parties prenantes. Il vise à réduire le temps passé sur les tâches de documentation, leur permettant de se concentrer sur la science essentielle.

environmental science ChatGPT prompts workflow optimization

RESEARCHarXiv CS.LG·04/05/2026

Human-in-the-Loop Meta Bayesian Optimization for Fusion Energy and Scientific Applications

Cet article présente l'Optimisation Bayésienne Méta avec Intervention Humaine (HL-MBO), un cadre qui intègre les connaissances d'experts avec l'apprentissage automatique en peu d'exemples pour accélérer la découverte dans les domaines scientifiques à données rares. Il est démontré que HL-MBO surpasse les méthodes d'optimisation bayésienne actuelles dans l'optimisation du rendement énergétique de la fusion et d'autres benchmarks.

Bayesian Optimization machine learning Fusion Energy scientific research

RESEARCHarXiv CS.LG·il y a 17j

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

Cet article explore la formation de modèles linguistiques pour prévoir le succès empirique des idées de recherche en évaluant des paires d'idées par rapport à des résultats objectifs. Le SFT améliore considérablement les performances par rapport à GPT-5, et le RLVR permet d'entraîner des modèles à découvrir des chemins de raisonnement interprétables pour cette tâche de prévision.

language models research evaluation machine learning AI forecasting

RESEARCHarXiv CS.AI·il y a 15j

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

SciAtlas est un graphe de connaissances multidisciplinaire à grande échelle, conçu pour s'attaquer à l'explosion d'informations dans la production universitaire. Intégrant des millions d'articles et des milliards d'entités, il offre un réseau structuré pour la recherche scientifique automatisée et une intégration interdisciplinaire approfondie.

Knowledge Graph information management research tools AI agents