Amazon QuickSight
サーバーレスの BI サービスで、SPICE エンジンによる高速なインメモリ分析と、ダッシュボードの埋め込み機能を備えている。
概要
Amazon QuickSight は、サーバーレスアーキテクチャで提供されるビジネスインテリジェンス (BI) サービスです。独自のインメモリエンジン SPICE (Super-fast, Parallel, In-memory Calculation Engine) がデータを圧縮・キャッシュし、数億行規模のデータセットに対してもサブ秒のレスポンスでインタラクティブな分析を実現します。ダッシュボードを自社アプリケーションに埋め込む Embedded Analytics 機能や、自然言語で質問するだけでグラフを自動生成する Q (Natural Language Query) 機能を備え、データ分析の民主化を推進します。セッション単位の従量課金モデルにより、閲覧頻度の低いユーザーが多い組織でもコスト効率よく BI 環境を展開できます。
SPICE エンジンの仕組みとデータ更新戦略
QuickSight の分析速度を支えるのが SPICE エンジンです。データソース (Redshift、Athena、S3、RDS など) からインポートしたデータを独自の列指向フォーマットで圧縮し、分散メモリ上に保持します。クエリ実行時にデータソースへアクセスしないため、ソース側の負荷を気にせず大量のユーザーが同時にダッシュボードを操作できます。SPICE の容量はエディションとユーザー数に応じて割り当てられ、Enterprise Edition では 1 ユーザーあたり 10 GB が標準です。データの鮮度を保つには SPICE データセットのリフレッシュスケジュールを設定します。フルリフレッシュはデータセット全体を再インポートする方式で、差分リフレッシュは新規・更新行のみを取り込む方式です。差分リフレッシュは対応データソースが限られますが、大規模データセットのリフレッシュ時間を大幅に短縮できます。一方、SPICE を使わず Direct Query モードでデータソースにリアルタイム接続することも可能ですが、クエリのたびにソースに負荷がかかるため、同時利用者が多い環境では SPICE の利用が推奨されます。
埋め込みダッシュボードとマルチテナント設計
QuickSight の Embedded Analytics は、作成したダッシュボードを自社の Web アプリケーションや SaaS 製品に iframe で埋め込む機能です。SaaS ベンダーが顧客ごとに異なるデータを表示するマルチテナント構成を実現するには、行レベルセキュリティ (RLS) と名前空間の組み合わせが鍵になります。RLS はデータセットにフィルタルールを定義し、ログインユーザーの属性に応じて表示行を動的に制限します。名前空間はテナントごとにユーザーとグループを分離する論理的な境界で、あるテナントのユーザーが別テナントのダッシュボードにアクセスすることを防ぎます。埋め込み時の認証フローは、バックエンドで GenerateEmbedUrlForRegisteredUser API を呼び出して一時的な埋め込み URL を生成し、フロントエンドに返す方式が標準です。Azure の対応サービスである Power BI Embedded も同様の埋め込み機能を提供しますが、QuickSight はセッション課金のため閲覧頻度が低いユーザーが多い場合にコスト優位性があります。データ分析の関連書籍 (Amazon) では、BI ツールの選定基準や埋め込み設計のパターンが詳しく解説されています。
Q (自然言語クエリ) とセッション課金の経済性
QuickSight Q は、ビジネスユーザーが「先月の売上トップ 10 の商品は?」のように自然言語で質問すると、データセットのスキーマとメタデータを解釈して自動的にグラフやテーブルを生成する機能です。Q の精度を高めるには、データセットのフィールドに適切な説明 (Description) と同義語 (Synonyms) を設定するトピック定義が重要です。たとえば「売上」フィールドに「revenue」「sales」「売上高」を同義語として登録しておけば、どの表現で質問しても正しいフィールドが参照されます。トピック定義の品質が Q の実用性を左右するため、初期設定に十分な時間を投資する価値があります。課金モデルは Author (ダッシュボード作成者) が月額固定、Reader (閲覧者) がセッション単位の従量課金です。1 セッションは 30 分間で、月額上限が設定されているため、ヘビーユーザーでもコストが青天井にはなりません。全社展開で数千人の Reader がいても、実際にダッシュボードを開いたユーザー分だけ課金されるため、従来型の BI ツールのように全員分のライセンスを購入する必要がありません。この課金モデルは、利用頻度にばらつきがある大規模組織で特にコストメリットが大きくなります。