AWS Data Exchange Especializado2019年〜
Un marketplace de datos que permite buscar, suscribirse y utilizar fácilmente datasets de terceros
Qué hace
AWS Data Exchange es un servicio que facilita la búsqueda, suscripción y uso de datos de terceros en la nube. Los proveedores de datos publican datasets en el catálogo, y los suscriptores pueden acceder a ellos directamente en su cuenta AWS sin necesidad de construir pipelines de transferencia de datos. Soporta datos en archivos (S3), tablas (Redshift), APIs y datos de Amazon S3 Access Grants.
Casos de uso
Se utiliza para acceder a datos financieros de mercado (precios de acciones, índices), datos meteorológicos y geoespaciales, datos demográficos y de consumo, datasets de salud y ciencias de la vida, y datos de movilidad y transporte. Elimina la complejidad de negociar licencias y construir pipelines de ingesta de datos.
Analogía cotidiana
Piensa en él como una tienda de aplicaciones pero para datos. Así como descargas apps de una tienda con un clic, Data Exchange te permite suscribirte a datasets con unos pocos clics. Los datos se entregan directamente a tu cuenta AWS, listos para usar con tus herramientas de análisis.
¿Qué es AWS Data Exchange?
AWS Data Exchange es un marketplace de datos que conecta proveedores de datos con consumidores. Los proveedores publican datasets actualizados regularmente, y los consumidores se suscriben para recibir los datos directamente en su cuenta AWS. Elimina la necesidad de FTP, APIs personalizadas o acuerdos de transferencia complejos.
Catálogo y suscripciones
El catálogo de Data Exchange contiene más de 3,500 productos de datos de más de 300 proveedores. Puedes buscar por categoría (finanzas, salud, meteorología, etc.), previsualizar muestras de datos y suscribirte. Las suscripciones pueden ser gratuitas o de pago, con facturación integrada en tu factura de AWS.
Tipos de datos y entrega
Data Exchange soporta múltiples mecanismos de entrega: archivos en S3 (CSV, JSON, Parquet), tablas de Redshift (consultas directas), APIs REST (datos en tiempo real) y S3 Access Grants (acceso directo a datos del proveedor). Los datos se actualizan automáticamente según la frecuencia definida por el proveedor. Para más información sobre análisis de datos, los libros en Amazon son un buen recurso.
Cómo empezar
Abre AWS Data Exchange en la consola y explora el catálogo. Filtra por categoría o busca por palabra clave. Selecciona un producto, revisa la descripción y los términos, y suscríbete. Una vez suscrito, los datos se exportan a tu bucket S3 o se acceden directamente según el tipo de entrega. Usa Athena, Redshift o SageMaker para analizar los datos.
Aspectos a tener en cuenta
- データセットの価格はプロバイダーが設定するため、同種のデータでも価格差が大きい場合がある。複数プロバイダーを比較検討すること
- 購読したデータの利用範囲はデータ利用規約 (DUA) で定められるため、商用利用や再配布の可否を事前に確認すること