マネージドファイルシステム - Amazon FSx と EFS で実現する高性能な共有ストレージ

Amazon FSx と Amazon EFS を活用したマネージドファイルシステムの構築・運用方法を解説します。

クラウドファイルシステムの必要性と AWS の選択肢

エンタープライズアプリケーションの多くは、複数のサーバーやコンテナから同時にアクセスできる共有ファイルシステムを必要とします。コンテンツ管理システム、機械学習のトレーニングデータ、ビッグデータ分析のワークロード、ホームディレクトリの共有など、ファイルベースのストレージは依然として重要な役割を担っています。オンプレミスでは NetApp や Dell EMC の NAS アプライアンス、Windows ファイルサーバーなどを運用しますが、容量計画、ハードウェア保守、バックアップ管理、パフォーマンスチューニングに多大な工数がかかります。AWS は Amazon EFS (Elastic File System) と Amazon FSx ファミリーという 2 つのマネージドファイルストレージサービスを提供し、これらの運用負荷を大幅に削減します。EFS は Linux ワークロード向けの NFS ファイルシステム、FSx は Windows (FSx for Windows File Server)、高性能コンピューティング (FSx for Lustre)、NetApp ONTAP (FSx for NetApp ONTAP)、OpenZFS (FSx for OpenZFS) の 4 つのファイルシステムタイプを提供します。

この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。

Amazon EFS の特徴とユースケース

Amazon EFS はサーバーレスでフルマネージドな NFS ファイルシステムです。容量は自動的にペタバイト規模まで拡張・縮小され、事前のプロビジョニングが不要です。数千の EC2 インスタンスや ECS タスク、Lambda 関数から同時にマウントでき、NFS v4.1 プロトコルに準拠しています。EFS には Standard と One Zone の 2 つのストレージクラスがあり、さらにそれぞれに低頻度アクセス (IA) ティアが用意されています。EFS Intelligent-Tiering はアクセスパターンに基づいてファイルを自動的に最適なティアに移動し、最大 92% のコスト削減を実現します。EFS はサーバーレスアーキテクチャとの統合が優れており、Lambda 関数から直接マウントできる点が大きな差別化要因です。バースト性能モードでは、ストレージ容量に応じたベースラインスループットに加え、最大 100 MiB/s のバーストスループットを提供します。プロビジョンドスループットモードを選択すれば、ストレージ容量に関係なく必要なスループットを確保できます。

Amazon FSx ファミリーの活用

Amazon FSx は用途に応じた 4 つのファイルシステムタイプを提供します。FSx for Windows File Server は SMB プロトコルに対応し、Active Directory 統合、DFS 名前空間、シャドウコピーなど Windows ネイティブの機能をフルサポートします。オンプレミスの Windows ファイルサーバーからの移行先として最適で、既存のグループポリシーやアクセス権限をそのまま引き継げます。FSx for Lustre は高性能コンピューティング (HPC) や機械学習のトレーニングに最適化されたファイルシステムで、数百 GB/s のスループットと数百万 IOPS を実現します。S3 バケットとの透過的な統合により、S3 上のデータセットを高速なファイルシステムとして直接アクセスできます。以下は FSx for Lustre ファイルシステムを作成する CLI 例です。 aws fsx create-file-system --file-system-type LUSTRE --storage-capacity 1200 --subnet-ids subnet-0123456789abcdef0 --lustre-configuration DeploymentType=PERSISTENT_2,PerUnitStorageThroughput=250,DataCompressionType=LZ4 FSx for NetApp ONTAP はオンプレミスの NetApp 環境からの移行に対応し、SnapMirror、FlexClone、データ重複排除などの ONTAP 機能を AWS 上で利用できます。FSx for OpenZFS はスナップショット、クローン、データ圧縮を備えた汎用ファイルシステムとして、開発環境やデータベースのバックエンドストレージに適しています。

さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。

まとめ - マネージドファイルシステムの選択指針

Linux ワークロードには EFS、Windows 環境には FSx for Windows File Server、HPC や ML には FSx for Lustre、NetApp 移行には FSx for NetApp ONTAP と、ワークロードの特性に応じた最適なサービスを選択できます。EFS の Intelligent-Tiering による自動コスト最適化、FSx for Lustre の S3 統合による高速データアクセス、FSx for Windows File Server の Active Directory 統合は、それぞれのユースケースで独自の価値を提供します。ファイルシステムの選択は、プロトコル要件、パフォーマンス要件、既存環境との互換性の 3 つの軸で判断することが重要です。

AWS の優位点

  • EFS はサーバーレスで容量が自動拡張され、数千のインスタンスや Lambda 関数から同時マウントが可能
  • FSx ファミリーは Windows File Server、Lustre、NetApp ONTAP、OpenZFS の 4 タイプを提供する
  • EFS Intelligent-Tiering はアクセスパターンに基づく自動ティア移動で最大 92% のコスト削減を実現する
  • FSx for Lustre は数百 GB/s のスループットを実現し、S3 との透過的統合で HPC ワークロードに最適
  • FSx for Windows File Server は Active Directory 統合と SMB プロトコルでオンプレミスからの移行が容易
  • AWS Backup との統合により自動バックアップとクロスリージョンコピーによる災害復旧を構成できる

同じテーマの記事

AWS Backup Gateway でオンプレミス VMware VM を保護 - ハイブリッドバックアップ戦略 Backup Gateway による VMware 仮想マシンのバックアップ、リストア、AWS Backup との統合を解説します。 一元バックアップ管理 - AWS Backup で実現するデータ保護戦略 AWS Backup を活用した一元的なバックアップ管理を解説します。EC2、RDS、DynamoDB、EFS、S3 など複数の AWS サービスのバックアップを統合管理し、コンプライアンス要件を満たすデータ保護戦略の構築方法を紹介します。 Amazon Data Lifecycle Manager で自動化する EBS スナップショット管理 - ポリシー設計と保持戦略 DLM による EBS スナップショットの自動作成、保持ポリシー、クロスリージョンコピーの設定を解説します。 Amazon EBS のボリューム設計と運用 - gp3・io2 の選定基準とスナップショット戦略 Amazon EBS のボリュームタイプ選定、IOPS・スループットの設計指針、スナップショットによるバックアップ戦略を実践的に解説します。 Amazon EBS の暗号化とスナップショット共有 - クロスアカウント・クロスリージョンの設計 EBS のデフォルト暗号化、スナップショットのクロスアカウント共有、クロスリージョンコピーによる DR 設計を解説します。 Amazon EFS で構築する共有ファイルストレージ - Lambda・ECS・EC2 からのマウントと設計指針 Amazon EFS のパフォーマンスモード選定、Lambda・ECS・EC2 からのマウント方法、ライフサイクル管理によるコスト最適化を解説します。 Amazon FSx で選ぶマネージドファイルシステム - Lustre、Windows、ONTAP、OpenZFS の使い分け FSx の 4 つのファイルシステムタイプの特徴と使い分け、S3 連携、パフォーマンス設計を解説します。 Amazon S3 Glacier のアーカイブ戦略 - ストレージクラスの選定と取り出しオプション S3 Glacier Instant Retrieval、Flexible Retrieval、Deep Archive の選定基準、ライフサイクルポリシーによる自動階層化を解説します。 ハイブリッドストレージ - AWS Storage Gateway によるオンプレミスとクラウドの統合 AWS Storage Gateway を使ったオンプレミスとクラウドストレージの統合を解説。S3 File Gateway・FSx File Gateway・Volume Gateway・Tape Gateway の 4 タイプの使い分けと導入パターンを紹介します。 オブジェクトストレージ戦略 - Amazon S3 で実現するデータ管理の最適化 Amazon S3 を活用したオブジェクトストレージ戦略を解説します。 Amazon S3 のストレージ設計 - ストレージクラスの使い分けとライフサイクルポリシー S3 のストレージクラス選定、ライフサイクルポリシー、Intelligent-Tiering によるコスト最適化を解説します。