新機能重要度 中

AWS Lake Formation が Amazon S3 でのテーブルデータへのアクセスを拡張

AWS Lake Formation は、登録された S3 ロケーションに対する一時的でスコープされたクレデンシャルを提供し、SELECT および SUPER パーミッションでデータの読み取りと読み書きを可能にする。Amazon EMR 7.13 以降で組み込みサポートされ、Spark や Trino アプリケーションから直接データにアクセスできる。

AWS Lake Formation は、AWS Glue データカタログに登録されたテーブルのアンダーライニングデータである Amazon S3 のデータを読み書きできるようにする。この機能により、SQL クエリと直接のファイルアクセスに一貫した権限セットを提供する。SELECT パーミッションでは読み取りアクセス、SUPER パーミッションでは読み書きアクセスが可能で、Amazon EMR 7.13 以降で組み込みサポートされる。これにより、モデルトレーニングやフィーチャーエンジニアリング、デバッグなど、ファイルレベルアクセスを必要とするタスクに対して、Spark ジョブから直接データにアクセスできる。Apache Spark や Trino アプリケーションは、API または AWS が提供するオープンソースプラグインを介して統合できる。また、すべてのアクセスは AWS CloudTrail にログ記録され、SQL とファイルベースの操作にわたる統一された監査証跡が提供される。この機能は、AWS Lake Formation が提供されているすべての AWS リージョンで追加料金なしで利用できる。

AWS 公式の元記事を読む