Amazon Kinesis のアイコン

Amazon Kinesis Popular2013年〜

Servicio para recopilar, procesar y analizar datos de streaming en tiempo real

Qué hace

Amazon Kinesis es una familia de servicios para recopilar, procesar y analizar datos de streaming en tiempo real a escala. Kinesis Data Streams maneja la recopilación y procesamiento de datos de stream, Kinesis Data Firehose entrega datos de stream a S3, Redshift y otros destinos, y Kinesis Data Analytics proporciona análisis basado en SQL/Flink de datos de stream.

Casos de uso

Se utiliza para procesamiento en tiempo real de datos de sensores de dispositivos IoT, análisis de clickstream de sitios web, agregación y análisis de logs en tiempo real, monitorización de transacciones financieras en tiempo real y análisis de comportamiento de jugadores de juegos.

Analogía cotidiana

Es como una cinta transportadora. Los productos (datos) que fluyen continuamente desde una fábrica (fuente de datos) se transportan en una cinta (stream), donde se someten a inspección (procesamiento), clasificación (análisis) y empaquetado (almacenamiento) de forma secuencial.

¿Qué es Kinesis?

Amazon Kinesis es una familia de servicios para procesamiento de datos en tiempo real. Mientras que el procesamiento por lotes 'acumula datos y los procesa todos a la vez', Kinesis permite el procesamiento de streams que 'procesa los datos en el momento en que se generan'. Tiene la escalabilidad para manejar millones de registros por segundo.

Kinesis Data Streams y Firehose

Kinesis Data Streams es un servicio para procesar datos de stream con aplicaciones personalizadas. Se controla el rendimiento ajustando el número de shards y se procesan los datos con Lambda o consumidores personalizados. Kinesis Data Firehose es un servicio que entrega automáticamente datos de stream a S3, Redshift, OpenSearch, Splunk y más. Puede configurar la transformación y entrega de datos sin escribir código. Para profundizar en el conocimiento práctico de Kinesis Data Streams y Firehose, los libros técnicos en Amazon son útiles.

Primeros pasos

Seleccione 'Crear data stream' en la consola de Kinesis y especifique un nombre de stream y modo de capacidad (bajo demanda o aprovisionado). Envíe datos usando la API PutRecord del SDK de AWS y configure Lambda como consumidor para completar su pipeline de procesamiento en tiempo real. Con Firehose, puede acumular datos en S3 sin escribir código.

Aspectos a tener en cuenta

  • El período de retención de Data Streams es de 24 horas por defecto y se puede extender hasta 365 días, pero los costos aumentan con una retención más larga
  • Elija Firehose para entrega simple de datos, y Data Streams cuando se necesite procesamiento personalizado
共有するXB!