分析と検索

Athena、OpenSearch、Glue、データレイク構築など、AWS のデータ分析と検索サービスに関する比較記事

Amazon DataZone で実現するデータガバナンス - データの発見・共有・アクセス制御

ドメインベースのデータカタログを構築し、サブスクリプションワークフローでデータの発見・共有・アクセス制御を実現する手法を紹介します。

最終更新: 2026-05-27

AWS Entity Resolution で実現するレコードマッチング - 顧客データの名寄せと統合

Entity Resolution による複数データソースのレコードマッチング、マッチングワークフローの設計を解説します。

最終更新: 2026-05-15

Amazon OpenSearch Service で構築するログ分析基盤 - インデックス設計とダッシュボード構築

ログ分析基盤を構築し、インデックスライフサイクル管理でコストを最適化する。OpenSearch Dashboards と Serverless モードの活用を紹介します。

最終更新: 2026-05-12

Amazon EMR で実行する Apache Spark - ビッグデータ処理のクラスタ設計とコスト最適化

EMR による Spark クラスタの構築、EMR Serverless との使い分け、スポットインスタンス活用によるコスト最適化を解説します。

最終更新: 2026-05-08

AWS Clean Rooms で実現するプライバシー保護型データコラボレーション

データを共有・コピーせずに複数企業間で共同分析を実行する。集計ルールによる個人特定防止と Cryptographic Computing による暗号化分析を紹介します。

最終更新: 2026-05-05

Amazon EMR Serverless で Spark ジョブをサーバーレスに実行 - クラスタ管理不要のビッグデータ処理

EMR Serverless による Spark/Hive ジョブの実行、ジョブランの設計、コスト最適化を解説します。

最終更新: 2026-05-01

Amazon QuickSight で構築する BI ダッシュボード - サーバーレス分析と埋め込み可視化

SPICE エンジンで高速クエリを実現し、埋め込み API で自社アプリに BI 機能を統合する。Q 機能の自然言語クエリと Reader のセッション課金を紹介します。

最終更新: 2026-04-29

Amazon OpenSearch Serverless の実践ガイド - OCU 設計とコレクションタイプ別の最適化戦略

Amazon OpenSearch Serverless は、クラスターの運用管理を不要にしながら検索・分析ワークロードを自動スケーリングで処理するフルマネージドサービスです。OCU の課金モデルとコレクションタイプの選定基準、インデックス設計のベストプラクティスを実務視点で解説します。

最終更新: 2026-04-24

Amazon Kinesis で構築するリアルタイムデータパイプライン - Data Streams と Data Firehose の使い分け

Data Streams でリアルタイムデータを取り込み、Data Firehose で S3・Redshift・OpenSearch に自動配信する。シャード設計とオンデマンドモードの使い分けでストリーミングパイプラインを構築する方法を解説します。

最終更新: 2026-03-10

デジタルツイン - AWS IoT TwinMaker で物理空間の 3D デジタルレプリカを構築する

AWS IoT TwinMaker を使ったデジタルツインの構築を解説。3D シーンの作成、IoT データとの連携、Grafana ダッシュボード統合、産業設備の可視化を紹介します。

最終更新: 2026-02-21

顧客 ID 統合 - AWS Entity Resolution で分散した顧客データを名寄せする

AWS Entity Resolution を使った顧客データの名寄せ (エンティティ解決) を解説。ML ベースのマッチング、ルールベースのマッチング、プライバシー保護、Clean Rooms との統合を紹介します。

最終更新: 2026-02-10

プライバシー保護データ分析 - AWS Clean Rooms で安全にデータをコラボレーションする

AWS Clean Rooms を使ったプライバシー保護データ分析を解説。複数組織間のデータコラボレーション、分析ルールによるアクセス制御、差分プライバシーの活用を紹介します。

最終更新: 2026-02-02

Amazon MSK で構築する Apache Kafka ストリーミング基盤 - クラスタ設計と運用

Apache Kafka のマネージドクラスタを設計し、MSK Serverless との使い分けと MSK Connect によるデータ連携パターンを紹介します。

最終更新: 2026-02-01

BI ダッシュボード可視化 - Amazon QuickSight で実現するデータドリブンな意思決定基盤

Amazon QuickSight によるインタラクティブな BI ダッシュボードの構築と、Athena との連携によるサーバーレスデータ分析基盤を解説します。SPICE エンジンによる高速可視化と組織全体へのインサイト共有の実践手法を紹介します。

最終更新: 2026-01-13

Amazon Redshift で構築するクラウドデータウェアハウス - Serverless と RA3 の使い分け

Serverless と RA3 プロビジョンドの選定基準を明確にし、データ共有と Spectrum によるデータレイク連携でサイロ化を防ぐ手法を紹介します。

最終更新: 2025-12-31

データレイクガバナンス - AWS Lake Formation による一元的なアクセス制御

AWS Lake Formation を使ったデータレイクの構築・アクセス制御・ガバナンスを解説。S3 ベースのデータレイクに対する列レベル・行レベルのきめ細かな権限管理と Glue ・ Athena との統合を紹介します。

最終更新: 2025-12-24

AWS Glue で構築する ETL パイプライン - クローラーとジョブの設計

クローラーでスキーマを自動検出し、Glue ジョブで ETL 処理を実行する。データカタログの活用パターンと Glue Studio によるビジュアル開発を紹介します。

最終更新: 2025-12-20

IoT データ分析 - AWS IoT Analytics でデバイスデータを構造化・分析する

AWS IoT Analytics を使った IoT デバイスデータの収集・前処理・分析パイプラインを解説。チャネル・パイプライン・データストア・データセットの 4 コンポーネントと QuickSight 連携を紹介します。

最終更新: 2025-12-13

産業 IoT モニタリング - AWS IoT SiteWise で設備データを収集・可視化する

AWS IoT SiteWise を使った産業設備のデータ収集・モデリング・可視化を解説。OPC-UA 対応ゲートウェイ、アセットモデル、SiteWise Monitor ダッシュボードを紹介します。

最終更新: 2025-12-09

AWS Lake Formation で構築するデータレイク - きめ細かいアクセス制御とデータカタログ

列・行レベルのきめ細かいアクセス制御とタグベース管理でデータレイクのガバナンスを確立する。Glue Data Catalog との統合とクロスアカウントアクセスを紹介します。

最終更新: 2025-12-02

Amazon EMR によるビッグデータ処理 - Spark と Hive の実行環境

EMR クラスターで Spark ジョブと Hive クエリを実行し、EMR Serverless との使い分けとマネージドスケーリングによるコスト最適化を紹介します。

最終更新: 2025-11-25

Amazon Redshift のパフォーマンスチューニング - 分散キー・ソートキー・ WLM の最適化

Redshift の分散スタイルとソートキーの選定、ワークロード管理 (WLM) の設計、AQUA によるクエリ高速化を解説します。

最終更新: 2025-11-18

Amazon S3 と Lake Formation で構築するデータレイク - 設計パターンとガバナンス

S3 をストレージ基盤とし Lake Formation できめ細かいアクセス制御を実現するデータレイクの設計パターンを紹介。ETL パイプラインとコスト最適化も解説します。

最終更新: 2025-11-14

Amazon Managed Service for Apache Flink でリアルタイムストリーム処理 - ステートフル処理とウィンドウ集約

Apache Flink のフルマネージド環境で SQL またはJava/Python アプリケーションによるリアルタイムストリーム処理を実行する。ウィンドウ集計・パターン検出・Kinesis/MSK 連携の設計パターンを解説します。

最終更新: 2025-11-12

車両フリートデータ管理 - AWS IoT FleetWise で車両テレメトリを効率的に収集する

AWS IoT FleetWise を使った車両テレメトリデータの収集を解説。車両モデリング、エッジでのデータフィルタリング、クラウドへの効率的なデータ転送を紹介します。

最終更新: 2025-11-08

Amazon MSK Serverless で始めるイベントストリーミング - 運用ゼロの Kafka 環境構築

クラスタ管理不要の Kafka 環境を IAM 認証で構築し、EventBridge Pipes との統合でイベントストリーミングを簡素化する手法を紹介します。

最終更新: 2025-11-02

Amazon Quick の実践活用 - 部門別ユースケースとワークフロー自動化の設計パターン

営業・IT・財務など部門ごとの活用シナリオと、Quick Flows による通知・承認・多段階ワークフローの設計パターンを具体的に紹介します。

最終更新: 2025-10-29

データ検索と分析の実践 - OpenSearch による全文検索と可視化基盤の構築

Amazon OpenSearch Service を活用したデータ検索と分析の設計手法を解説し、全文検索、ログ分析、ダッシュボード可視化による分析基盤の構築方法を紹介します。

最終更新: 2025-10-15

ストリーミングデータ処理の設計 - Kinesis によるリアルタイムデータパイプラインの構築

Amazon Kinesis を活用したストリーミングデータ処理の設計手法を解説し、Data Streams、Data Firehose、Lambda 連携によるリアルタイムデータパイプラインの構築方法を紹介します。

最終更新: 2025-10-13

ブロックチェーンネットワーク構築 - Amazon Managed Blockchain と QLDB による分散台帳の活用

Amazon Managed Blockchain によるブロックチェーンネットワークの構築と、Amazon QLDB による検証可能な台帳データベースの活用方法を解説します。サプライチェーン管理や金融取引の透明性確保など、実践的なユースケースを紹介します。

最終更新: 2025-09-15

データマーケットプレイス活用 - AWS Data Exchange で実現するサードパーティデータの効率的な取得と活用

AWS Data Exchange を活用したサードパーティデータの取得と活用方法を解説します。S3 との統合によるデータパイプラインの構築と、データプロバイダーとしての公開手法を紹介します。

最終更新: 2025-09-03

リアルタイムデータストリーミング - Amazon Kinesis で実現する即時データ処理

Kinesis Data Streams と Data Firehose を組み合わせたリアルタイムデータパイプラインの設計パターンを解説。シャード設計、バッファリング、Lambda 変換、S3・Redshift・OpenSearch への配信を紹介します。

最終更新: 2025-08-29

マネージド Kafka ストリーミング - Amazon MSK で実現する大規模リアルタイムデータパイプライン

Amazon MSK (Managed Streaming for Apache Kafka) によるフルマネージド Kafka クラスタの構築と、Kinesis との使い分けを解説します。大規模なリアルタイムデータストリーミング基盤の設計パターンを紹介します。

最終更新: 2025-08-28

量子コンピューティングサービス - Amazon Braket で始める量子アルゴリズム開発

Amazon Braket を活用した量子コンピューティングの実践方法を解説します。量子回路シミュレーター、実機量子コンピューターへのアクセス、ハイブリッド量子古典アルゴリズムの実装など、量子技術の活用方法と Lambda との連携パターンを紹介します。

最終更新: 2025-08-20

動画トランスコーディング - AWS Elemental MediaConvert で実現するスケーラブルな映像変換基盤

AWS Elemental MediaConvert と S3 を活用した動画トランスコーディングパイプラインの構築方法を解説します。マルチフォーマット出力、HDR 対応、コスト効率の高いサーバーレス映像処理の実践手法を紹介します。

最終更新: 2025-08-15

AWS Data Exchange で活用するサードパーティデータ - データ調達とサブスクリプション管理

サードパーティのデータ製品を Marketplace 経由で調達し、S3 への自動配信パイプラインを構築する。自社データの製品化と収益化の手法も紹介します。

最終更新: 2025-08-01