DOC27
Evaluating Deep Agents using LangSmith on AWS
AWS Machine Learning Blog·28. Mai 2026
Dieser Beitrag bietet eine praktische Anleitung, die Erkenntnisse aus LangChain und Anthropic kombiniert, um tiefe KI-Agenten zu bewerten. Er beschreibt, wie Bewertungsmodelle angewendet, Offline-Bewertungen mit pytest und LangSmith erstellt und Online-Überwachung mit einem Text-zu-SQL-Agenten auf Amazon Bedrock konfiguriert werden können.
Original lesen ↗