← heapsort-ai

scientific research

12 items

RESEARCHarXiv CS.AI·il y a 22h

A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline

Cette recherche évalue empiriquement des agents de codage d'IA à usage général sur un pipeline de découverte de données en neurosciences, évaluant leur capacité à automatiser des tâches scientifiques complexes. Elle constate que les agents peuvent résoudre des étapes individuelles du pipeline mais rencontrent des difficultés avec le jugement scientifique en l'absence de critères d'itération prédéfinis.

46
RESEARCH↑ trendingReddit r/LocalLLaMA·il y a 25j

internlm/Intern-S2-Preview · Hugging Face

Intern-S2-Preview est un modèle de fondation multimodal scientifique efficace de 35B qui atteint des performances comparables à celles de modèles à l'échelle du billion en explorant la mise à l'échelle des tâches et l'entraînement en chaîne complète. Il excelle dans des centaines de tâches scientifiques professionnelles tout en conservant de solides capacités de raisonnement général, de compréhension multimodale et d'agent.

internlm/Intern-S2-Preview · Hugging Face
42
RESEARCHarXiv CS.AI·07/04/2026

Toward Full Autonomous Laboratory Instrumentation Control with Large Language Models

Este trabalho explora o potencial de Grandes Modelos de Linguagem (LLMs), como o ChatGPT, e agentes de IA para automação e controle de instrumentação laboratorial. Demonstra-se como essas ferramentas reduzem barreiras de programação e podem evoluir para agentes autônomos capazes de operar equipamentos científicos e refinar estratégias de controle.

28
RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

27
RESEARCHarXiv CS.AI·16/04/2026

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Ce travail présente SciFi, un cadre agentique sûr, léger et convivial pour l'exécution autonome de tâches scientifiques. Il combine un environnement isolé, une boucle d'agent à trois couches et un mécanisme d'auto-évaluation pour assurer un fonctionnement fiable, tirant parti des LLM pour automatiser les charges de travail scientifiques routinières et libérer les chercheurs pour des activités créatives.

27
DOCDEV.to AI·il y a 20j

35 ChatGPT Prompts for Environmental Scientists: Accelerate Research, Reporting, and Stakeholder Communication

Ce contenu propose 35 invites ChatGPT conçues pour aider les scientifiques de l'environnement à rationaliser leurs recherches, leurs rapports et leur communication avec les parties prenantes. Il vise à réduire le temps passé sur les tâches de documentation, leur permettant de se concentrer sur la science essentielle.

27
RESEARCHarXiv CS.LG·04/05/2026

Human-in-the-Loop Meta Bayesian Optimization for Fusion Energy and Scientific Applications

Cet article présente l'Optimisation Bayésienne Méta avec Intervention Humaine (HL-MBO), un cadre qui intègre les connaissances d'experts avec l'apprentissage automatique en peu d'exemples pour accélérer la découverte dans les domaines scientifiques à données rares. Il est démontré que HL-MBO surpasse les méthodes d'optimisation bayésienne actuelles dans l'optimisation du rendement énergétique de la fusion et d'autres benchmarks.

27
RESEARCHarXiv CS.LG·il y a 17j

Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation

Cet article explore la formation de modèles linguistiques pour prévoir le succès empirique des idées de recherche en évaluant des paires d'idées par rapport à des résultats objectifs. Le SFT améliore considérablement les performances par rapport à GPT-5, et le RLVR permet d'entraîner des modèles à découvrir des chemins de raisonnement interprétables pour cette tâche de prévision.

27
RESEARCHarXiv CS.AI·il y a 15j

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

SciAtlas est un graphe de connaissances multidisciplinaire à grande échelle, conçu pour s'attaquer à l'explosion d'informations dans la production universitaire. Intégrant des millions d'articles et des milliards d'entités, il offre un réseau structuré pour la recherche scientifique automatisée et une intégration interdisciplinaire approfondie.

27