新機能重要度 中

Amazon Bedrock AgentCore がエージェントの最適化機能を導入

Amazon Bedrock AgentCore は、エージェントの動作を分析し、データに基づいた修正を提案する最適化機能を提供する。これにより、生産環境でのエージェントのパフォーマンスが継続的に改善される。

本日、AWS は Amazon Bedrock AgentCore で新たな最適化機能を発表した。この機能は、生産環境のトレースを継続的な改善に活用する。最も危険なエージェントの失敗は、エラーを発生させない「静かな失敗」であり、ダッシュボードには正常に表示されるが、顧客からの苦情として表面化する。AgentCore は、エージェントの動作を理解し、データに基づいた修正を生成し、その有効性を証明するループを提供する。エージェントの動作を理解するために、失敗、インテント、軌跡の洞察を数百セッションにわたって提供し、ダッシュボードや一回のトレースレビューでは検出できないパターンを明らかにする。失敗の洞察は、再発する失敗パターンを見つけ、それぞれの根本原因を説明し、広がりをランキングで表示して、最も多くのユーザーに影響を与える問題を最初に修正できるようにする。インテントの洞察は、ユーザーの試みによってリクエストをクラスター化し、軌跡の洞察は、エージェントがタスクを通じて取る経路をグループ化して、一般的なパターンや外れ値を明らかにする。顧客は継続的なモニタリングを有効にしたり、数分でターゲットの調査を実行できる。問題を確実に修正するために、推奨事項はトレースと評価出力を分析して、システムプロンプトやツール説明の具体的な改善を提案し、エージェントの実際の動作に基づいて根拠がある。各推奨事項には、観察された失敗に関連する明確な理由付けが含まれ、検証の準備ができている。変更がユーザーに届く前に、バッチ評価は推奨事項を定義されたテストデータセットに対してテストし、複数の評価者に対する集計スコアを報告して、早期に回帰を検出する。顧客は「良い」とは何かを定義し、バッチ評価は各候補変更をその基準に対して大規模に測定する。A/B テストは、ライブプロダクショントラフィックを分割してエージェントバージョンの比較を行い、実際の条件下での改善を確認する。これにより、変更がテストデータだけでなくプロダクションでも機能することを統計的に証明できる。これらの機能は、AgentCore のランタイム、AWS Lambda、Amazon EKS、または AWS 外の環境で動作するエージェントに関係なく動作する。失敗、インテント、軌跡の洞察は本日 13 の AWS リージョンでプレビューとして利用可能。バッチ評価、推奨事項、A/B テストは本日 14 の AWS リージョンで一般提供として利用可能。詳細は Amazon Bedrock AgentCore を参照するか、ドキュメントを確認してください。

AWS 公式の元記事を読む