AWS Data Exchange
サードパーティのデータセットを簡単に検索・購読・利用できるデータマーケットプレイス
何ができるか
AWS Data Exchange は、サードパーティが提供するデータセットを AWS 上で簡単に検索、購読、利用できるデータマーケットプレイスです。金融データ、気象データ、地理空間データ、ヘルスケアデータなど、300 以上のデータプロバイダーから数千のデータセットが提供されています。購読したデータは S3 に直接配信され、Athena、Redshift、SageMaker などの AWS 分析サービスとシームレスに連携できます。データプロバイダーとして自社データを公開・販売することも可能です。
どのような場面で使うか
金融市場データの取得による投資分析やリスク管理、気象データを活用した需要予測や物流最適化、人口統計データによるマーケティング戦略の立案、地理空間データを使った店舗立地分析、医療研究データの取得による創薬研究の加速、自社保有データの外部販売による新たな収益源の創出など、データ駆動型の意思決定全般で活用されています。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
身近な例え
データのオンラインショッピングモールに例えるとわかりやすいでしょう。欲しいデータ (商品) をカタログ (マーケットプレイス) から探して購入すると、自宅 (S3) に直接届けてもらえます。以前は各データ提供元に個別に連絡して契約書を交わし、FTP でダウンロードする手間がありましたが、Data Exchange ならワンクリックで購読開始できます。
Data Exchange とは
AWS Data Exchange は、2019 年にリリースされたデータマーケットプレイスサービスです。企業がデータ駆動型の意思決定を行うには、社内データだけでなく外部データの活用が不可欠です。しかし、従来のデータ取得プロセスは、プロバイダーとの個別交渉、契約手続き、データ転送の技術的対応など多くの手間がかかりました。Data Exchange はこれらのプロセスを標準化し、AWS マーケットプレイスの仕組みを活用して効率的なデータ取引を実現します。
データの検索と購読
Data Exchange では、カテゴリ別やキーワード検索でデータセットを探せます。各データセットにはサンプルデータ、更新頻度、データ形式、価格などの詳細情報が記載されており、購入前に内容を確認できます。無料のデータセットも多数提供されています。購読すると、データは自動的に S3 バケットに配信され、更新があれば新しいリビジョンが自動的に通知されます。API を使ったプログラマティックなデータ取得にも対応しています。
データプロバイダーとしての活用
Data Exchange はデータの消費者だけでなく、プロバイダーとしてデータを公開・販売する機能も提供しています。自社が保有するデータセットを Data Exchange に登録し、価格設定やアクセス条件を定義して公開できます。データの配信は AWS が自動的に処理するため、プロバイダーはデータの品質維持に集中できます。サブスクリプション型の課金モデルにより、継続的な収益を得ることも可能です。
Azure・オンプレミスとの比較
AWS の優位点
- 300 以上のデータプロバイダーから数千のデータセットが集約されたマーケットプレイスにより、個別交渉なしにワンクリックでデータ購読を開始でき、データ調達の時間を大幅に短縮できる
- 購読データが S3 に直接配信され、Athena、Redshift、SageMaker などの AWS 分析サービスとシームレスに連携できるため、データ取得から分析までのパイプラインを最小限の設定で構築できる
- データプロバイダーとして自社データを公開・販売する機能も備えており、データの消費と提供の両方を単一プラットフォームで管理でき、新たな収益源を創出できる
注意点
- データセットの価格はプロバイダーが設定するため、同種のデータでも価格差が大きい場合がある。複数プロバイダーを比較検討すること
- 購読したデータの利用範囲はデータ利用規約 (DUA) で定められるため、商用利用や再配布の可否を事前に確認すること
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。