Amazon Bedrock AgentCore がエージェントの最適化機能を導入

本日、AWS は Amazon Bedrock AgentCore で新たな最適化機能を発表した。この機能は、生産環境のトレースを継続的な改善に活用する。最も危険なエージェントの失敗は、エラーを発生させない「静かな失敗」であり、ダッシュボードには正常に表示されるが、顧客からの苦情として表面化する。AgentCore は、エージェントの動作を理解し、データに基づいた修正を生成し、その有効性を証明するループを提供する。エージェントの動作を理解するために、失敗、インテント、軌跡の洞察を数百セッションにわたって提供し、ダッシュボードや一回のトレースレビューでは検出できないパターンを明らかにする。失敗の洞察は、再発する失敗パターンを見つけ、それぞれの根本原因を説明し、広がりをランキングで表示して、最も多くのユーザーに影響を与える問題を最初に修正できるようにする。インテントの洞察は、ユーザーの試みによってリクエストをクラスター化し、軌跡の洞察は、エージェントがタスクを通じて取る経路をグループ化して、一般的なパターンや外れ値を明らかにする。顧客は継続的なモニタリングを有効にしたり、数分でターゲットの調査を実行できる。問題を確実に修正するために、推奨事項はトレースと評価出力を分析して、システムプロンプトやツール説明の具体的な改善を提案し、エージェントの実際の動作に基づいて根拠がある。各推奨事項には、観察された失敗に関連する明確な理由付けが含まれ、検証の準備ができている。変更がユーザーに届く前に、バッチ評価は推奨事項を定義されたテストデータセットに対してテストし、複数の評価者に対する集計スコアを報告して、早期に回帰を検出する。顧客は「良い」とは何かを定義し、バッチ評価は各候補変更をその基準に対して大規模に測定する。A/B テストは、ライブプロダクショントラフィックを分割してエージェントバージョンの比較を行い、実際の条件下での改善を確認する。これにより、変更がテストデータだけでなくプロダクションでも機能することを統計的に証明できる。これらの機能は、AgentCore のランタイム、AWS Lambda、Amazon EKS、または AWS 外の環境で動作するエージェントに関係なく動作する。失敗、インテント、軌跡の洞察は本日 13 の AWS リージョンでプレビューとして利用可能。バッチ評価、推奨事項、A/B テストは本日 14 の AWS リージョンで一般提供として利用可能。詳細は Amazon Bedrock AgentCore を参照するか、ドキュメントを確認してください。

Amazon Bedrock

AWS 公式の元記事を読む

近い時期のアップデート

新機能重要度中

Amazon Bedrock AgentCore が Bedrock Guardrails をポリシーでサポート

Amazon Bedrock AgentCore は、AI エージェントのセキュリティと安全性を強化する Bedrock Guardrails をポリシーでサポートする。エージェントのアクション出力やゲートウェイ呼び出し入力をリアルタイムで評価し、攻撃や機密データの漏洩を検出・ブロックする。

Amazon Bedrock

新機能重要度中

Amazon Quick に自律エージェントと複数データセット分析機能が追加

Amazon Quick は自然言語によるタスク指定や多データソース分析を可能にする新機能を追加する。これにより、継続的なタスク自動化やデータカタログを活用したセキュリティ管理を実現する。

新機能重要度中

AWS Glue Data Catalog がビジネスコンテキストとセマンティック検索をプレビュー

AWS Glue Data Catalog は、ビジネス用語やカスタムメタデータでテーブルを豊かにし、セマンティック検索でデータを見つけられるようになる。AI エージェントも信頼できる定義で動作できる。

新機能重要度中

AWS Outposts ラックで AMD ベースの bmn-cx3a インスタンスが提供開始

AWS Outposts は、5 世代 AMD EPYC プロセッサと最大 800 Gbps のネットワーク帯域を提供する bmn-cx3a インスタンスをサポートする。リアルタイム市場データ処理やテレコム 5G コアネットワークなどの高スループットワークロード向け。

Amazon EC2

新サービス重要度中

AWS Continuum をセキュリティに導入

AWS Continuum は、セキュリティリスクを機械速度で検出・優先順位付け・検証・修正する。既存ツールの検出結果を統合し、環境とビジネスのコンテキストで優先順位を付け、再現可能なプルーフで検証する。確認された脆弱性には、ガードライン内での迅速で取り消し可能な緩和策と、独自のレビューとデプロイプロセスを経由する持続的な修正を提供する

新機能重要度中

AWS DevOps Agent がカスタム SRE エージェントと MCP/A2A プロトコルをサポート

AWS DevOps Agent はカスタム SRE エージェント、bring-your-own サブエージェント、MCP/A2A プロトコルによるヘッドレスアクセスをサポートする。開発者は既存のツールから呼び出し可能で、Kiro や Claude などのコーディングアシスタントと連携できる。

関連する記事・用語