Amazon Rekognition

Servicio de análisis visual basado en aprendizaje automático que realiza detección de objetos, análisis facial, detección de texto y moderación de contenido en imágenes y videos

Descripción general

Amazon Rekognition es un servicio de visión por computadora basado en aprendizaje automático que analiza imágenes y videos para detectar objetos, escenas, rostros, texto, contenido inapropiado y actividades. No requiere experiencia en ML para su uso, proporcionando APIs pre-entrenadas y la capacidad de entrenar modelos personalizados con Custom Labels.

Diferenciación de APIs de análisis de imagen y características de precisión

Rekognition ofrece múltiples APIs especializadas: DetectLabels identifica objetos y escenas (miles de categorías), DetectFaces analiza atributos faciales (edad estimada, emociones, gafas, ojos abiertos), DetectText extrae texto impreso y manuscrito de imágenes, y DetectModerationLabels identifica contenido potencialmente inapropiado. Cada API tiene características de precisión diferentes según el caso de uso. Para detección de objetos, la precisión mejora con imágenes de alta resolución y buena iluminación. Custom Labels permite entrenar modelos específicos del dominio con tan solo unas docenas de imágenes etiquetadas, útil para inspección de calidad industrial o clasificación de productos específicos.

Diseño de colecciones faciales y búsqueda facial

Las colecciones faciales almacenan representaciones vectoriales de rostros para búsqueda por similitud. IndexFaces añade rostros a una colección, y SearchFacesByImage busca rostros similares en la colección. El diseño de colecciones debe considerar el caso de uso: una colección por organización para control de acceso, o colecciones separadas por evento para organización de fotos. La precisión de coincidencia se controla mediante umbrales de similitud configurables. Para sistemas de verificación de identidad, se recomienda un umbral alto (99%+) para minimizar falsos positivos. La función de detección de rostros en vivo (liveness detection) verifica que la imagen proviene de una persona real frente a la cámara, no de una foto o video reproducido.

Análisis de video y procesamiento de streaming

Rekognition Video analiza videos almacenados en S3 de forma asíncrona, detectando personas, objetos, actividades y contenido inapropiado a lo largo del video con marcas de tiempo. Para procesamiento en tiempo real, Rekognition Video se integra con Kinesis Video Streams para analizar flujos de video en vivo. Los casos de uso incluyen monitoreo de seguridad (detección de personas en zonas restringidas), análisis de retail (conteo de visitantes, mapas de calor) y moderación de contenido en plataformas de video. El seguimiento de personas (person tracking) asigna identificadores consistentes a individuos a lo largo del video, permitiendo análisis de trayectorias. Los resultados se entregan vía SNS para procesamiento posterior con Lambda.

共有するXB!