heapsort
DOC27

Evaluating Deep Agents using LangSmith on AWS

AWS Machine Learning Blog·28. Mai 2026

Dieser Beitrag bietet eine praktische Anleitung, die Erkenntnisse aus LangChain und Anthropic kombiniert, um tiefe KI-Agenten zu bewerten. Er beschreibt, wie Bewertungsmodelle angewendet, Offline-Bewertungen mit pytest und LangSmith erstellt und Online-Überwachung mit einem Text-zu-SQL-Agenten auf Amazon Bedrock konfiguriert werden können.

Original lesen