Kaggle

4 items

ARTICLE↑ trendingReddit r/MachineLearning·4/23/2026

2b or not 2b ? Custom LLM Scheduling Competition [P]

Ein Kaggle-Wettbewerb wurde gestartet, der sich auf die Optimierung der Token-Kosten für LLM-Antworten konzentriert, indem entschieden wird, ob ein kleines Modell ausgeführt oder eine Frage übersprungen werden soll. Ziel ist es, die gewichteten Kosten zu minimieren, unter Berücksichtigung von Rechenkosten, Fehlschlägen und Strafen für das Überspringen einer korrekten Antwort.

Kaggle Benchmarking model optimization resource management

RESEARCHarXiv CS.LG·vor 8T

LongDS-Bench: On the Failure of Long-Horizon Agentic Data Analysis

Diese Forschung stellt LongDS vor, einen neuen Benchmark zur Bewertung von KI-Agenten bei langfristigen, mehrstufigen Datenanalyseaufgaben, der 68 Aufgaben aus realen Kaggle-Notebooks umfasst. Es zeigt sich, dass die besten Modelle nur eine durchschnittliche Genauigkeit von 48,45% erreichen und die Leistung in späteren Phasen erheblich abfällt, was ein kritisches Versagen bei der Verfolgung des sich entwickelnden Analysekontexts hervorhebt.

Long-horizon tasks Kaggle AI Benchmarks data analysis

NEWSGoogle DeepMind Blog·3/17/2026

Measuring progress toward AGI: A cognitive framework

Uma nova estrutura cognitiva está sendo introduzida para medir o progresso em direção à AGI. Para auxiliar no desenvolvimento das avaliações pertinentes, um hackathon no Kaggle será lançado.

framework Kaggle Avaliação de IA progresso de IA

NEWSGoogle AI Blog·4/27/2026

Join the new AI Agents Vibe Coding Course from Google and Kaggle

Google und Kaggle legen ihren 5-tägigen Intensivkurs für KI-Agenten neu auf, und die Anmeldung ist jetzt offen. Dieses Programm konzentriert sich auf die Schulung von KI-Agenten, angeboten von zwei großen Technologieunternehmen.

education Kaggle Google AI agents

Join the new AI Agents Vibe Coding Course from Google and Kaggle