AWS Auto Scaling で実現する需要追従型インフラ - スケーリングポリシーの設計と最適化

Auto Scaling のスケーリングポリシー設計、ターゲット追跡、予測スケーリングの活用を解説します。

Auto Scaling の概要

この記事は約 3 分で読めます。 Auto Scaling はリソースを需要に応じて自動的にスケーリングするサービスです。トラフィックが増加するとインスタンスを追加し、減少すると削除します。過剰プロビジョニングによるコスト浪費と、不足によるパフォーマンス低下の両方を防止します。

この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。

スケーリングポリシーの設計

ターゲット追跡スケーリングは最も推奨されるポリシーで、CPU 使用率 70% や ALB リクエスト数 1000/分などの目標値を設定するだけで、Auto Scaling が自動的にキャパシティを調整します。予測スケーリングは過去 14 日間のトラフィックパターンを ML で分析し、将来の需要を予測してスケジュールベースでキャパシティを事前確保します。毎朝 9 時にトラフィックが急増するパターンでは、8:50 にスケールアウトを開始します。ウォームプールは AMI からの起動とアプリケーションの初期化を事前に完了したインスタンスを待機させ、スケールアウト時に即座にサービスインさせます。

さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。

まとめ

Auto Scaling はターゲット追跡と予測スケーリングで需要に自動追従するサービスです。ウォームプールでスケールアウトの応答時間を短縮し、コストとパフォーマンスを最適化します。

AWS の優位点

  • ターゲット追跡スケーリングで CPU 使用率やリクエスト数を目標値に維持し、需要に自動追従する
  • 予測スケーリングで過去のトラフィックパターンから需要を予測し、事前にキャパシティを確保する
  • ステップスケーリングで CloudWatch アラームの閾値に応じた段階的なスケーリングを実行できる
  • EC2、ECS、DynamoDB、Aurora のスケーリングを統合的に管理し、アプリケーション全体を最適化できる
  • ウォームプールで事前に初期化済みの EC2 インスタンスを待機させ、スケールアウトの所要時間を短縮できる

同じテーマの記事

バッチコンピューティング基盤 - AWS Batch で実現する大規模並列処理 AWS Batch を活用した大規模バッチ処理の構築方法を解説します。ジョブキュー、コンピューティング環境の自動スケーリング、Spot インスタンスによるコスト最適化など、科学計算や大規模データ処理に最適なバッチ基盤の設計を紹介します。 AWS Batch でバッチコンピューティングを自動化 - ジョブキューとコンピューティング環境の設計 AWS Batch によるジョブのスケジューリング、Fargate/EC2 コンピューティング環境の使い分け、スポットインスタンスの活用を解説します。 AWS Batch で実現する大規模バッチ処理 - ジョブキュー設計とコスト最適化 AWS Batch のジョブキュー設計、Fargate と EC2 コンピューティング環境の選定、スポットインスタンス活用によるコスト最適化を解説します。 放送品質ライブ配信 - AWS Elemental MediaLive と MediaPackage で大規模配信基盤を構築する AWS Elemental MediaLive と MediaPackage を使った放送品質のライブ配信基盤を解説。リアルタイムトランスコード、DRM、広告挿入、マルチ CDN 配信を紹介します。 AWS Deadline Cloud でマネージドレンダーファームを構築 - VFX レンダリングのクラウド移行 Deadline Cloud によるレンダーファームの構築、ジョブスケジューリング、スポットインスタンスによるコスト最適化を解説します。 EC2 Instance Connect で SSH キー管理を不要に - ブラウザとCLI からの安全な接続 EC2 Instance Connect によるキーレス SSH 接続、IAM ベースのアクセス制御、Endpoint の活用を解説します。 Amazon EC2 インスタンスの選び方 - インスタンスファミリーと購入オプションの最適化 EC2 のインスタンスファミリーの特徴、Graviton プロセッサの活用、購入オプションの使い分けを解説します。 エッジ・5G コンピューティング - AWS Wavelength と Local Zones で超低遅延を実現する AWS Wavelength と Local Zones を使った超低遅延コンピューティングを解説。5G ネットワークエッジでの処理、都市部への近接配置、ユースケースと通常リージョンとの使い分けを紹介します。 Amazon Elastic Transcoder でメディアファイルを変換 - プリセットとパイプラインの設計 Elastic Transcoder によるメディアファイルの変換、プリセットの選定、S3 連携パイプラインの構築を解説します。 Amazon EVS でハイブリッドクラウドを運用する - DR サイト構築とバースト対応 Amazon EVS を活用したハイブリッドクラウド運用を解説。DR サイトの構築、オンデマンドのキャパシティバースト、AWS サービスとの統合パターンを紹介します。 Amazon GameLift でマルチプレイヤーゲームサーバーをホスティング - マッチメイキングとフリート管理 GameLift によるゲームサーバーのデプロイ、FlexMatch マッチメイキング、スポットインスタンスの活用を解説します。 AWS IoT Greengrass で構築するエッジ IoT アプリケーション - ローカル処理とクラウド連携 IoT Greengrass によるエッジデバイスでのローカル処理、Lambda 関数のエッジ実行、デバイスシャドウとの同期を解説します。 AWS Ground Station で実現する衛星データ処理 - ダウンリンクから分析までのパイプライン Ground Station による衛星通信のスケジューリング、データのダウンリンク、EC2 でのリアルタイム処理を解説します。 ハイブリッドクラウドインフラ - AWS Outposts で実現するオンプレミスと AWS の統合基盤 AWS Outposts によるオンプレミス環境への AWS インフラ拡張と、EC2 との統合によるハイブリッドクラウドアーキテクチャの構築方法を解説します。データレジデンシー要件やレイテンシ要件への対応パターンを紹介します。 EC2 Image Builder で自動化する AMI パイプライン - ゴールデンイメージの構築とテスト Image Builder による AMI 構築パイプラインの設計、コンポーネントの作成、自動テストの実装を解説します。 AWS IoT Core で実現する IoT デバイス接続 - MQTT 通信とデバイスシャドウ IoT Core による MQTT デバイス接続、デバイスシャドウ、ルールエンジンによるデータルーティングを解説します。 AWS IoT SiteWise で構築する産業データ分析基盤 - 設備データの収集とアセットモデリング IoT SiteWise による産業機器データの収集、アセットモデルの設計、ダッシュボードでの可視化を解説します。 Amazon IVS で構築する低レイテンシライブ配信 - ストリーミングチャネルとチャット統合 IVS によるライブ配信チャネルの構築、プレーヤー SDK の統合、チャット機能の実装を解説します。 Amazon Lightsail で手軽に始めるクラウド - VPS 感覚で使える AWS の入口 Amazon Lightsail の固定料金プラン、WordPress やコンテナのデプロイ、EC2 への移行パスを解説します。 Amazon Lightsail でシンプルにクラウドを始める - VPS、データベース、コンテナの月額固定運用 Lightsail による VPS の構築、マネージドデータベース、コンテナデプロイ、月額固定料金の活用を解説します。 Amazon Lightsail で構築する WordPress サイト - SSL 設定からCDN 配信まで Lightsail での WordPress 構築、Let's Encrypt による SSL 設定、Lightsail CDN によるグローバル配信、バックアップ戦略を解説します。 AWS Elemental MediaConvert でサーバーレス動画変換 - HLS 配信とサムネイル生成 MediaConvert による動画トランスコーディング、HLS/DASH 出力、S3 + CloudFront での配信パイプラインを解説します。 Amazon Nimble Studio でクラウドクリエイティブ環境を構築 - VFX とアニメーション制作 Nimble Studio によるクラウドワークステーションの構築、ストレージ設計、リモートコラボレーションを解説します。 AWS Outposts でオンプレミスに AWS を拡張 - ハイブリッドクラウドの設計と運用 AWS Outposts によるオンプレミス環境への AWS インフラ拡張、ユースケース、ネットワーク設計と運用モデルを解説します。 AWS ParallelCluster で構築する HPC 環境 - Slurm クラスタの自動構築とスケーリング ParallelCluster による Slurm ベースの HPC クラスタ自動構築、スポットインスタンス活用、EFA による高速ノード間通信を解説します。 AWS RoboMaker でロボットアプリケーションを開発 - ROS 2 シミュレーションとフリート管理 RoboMaker による ROS 2 アプリケーションの開発、シミュレーション環境の構築、フリートデプロイを解説します。 衛星通信基盤 - AWS Ground Station で衛星データをクラウドに直接取り込む AWS Ground Station を使った衛星通信のクラウド統合を解説。地上局のマネージドサービス化、衛星データの取り込み・処理パイプライン、従来の地上局運用との比較を紹介します。 Amazon WorkSpaces で構築するクラウドデスクトップ - DaaS の設計とコスト最適化 WorkSpaces による仮想デスクトップの構築、バンドル選定、AutoStop によるコスト最適化を解説します。