Construcción de moderación de contenido de video con Amazon Rekognition - Garantizando la seguridad de plataformas UGC
Moderación automática de videos en plataformas UGC, automatización de flujos de trabajo de medios con búsqueda facial y detección de segmentos. Presentamos pipelines dirigidos por eventos con S3 y Lambda.
Descripción general de Rekognition Video API
La Video API de Rekognition analiza de forma asíncrona archivos de video almacenados en S3. Se inicia el análisis con APIs Start como StartContentModeration, StartLabelDetection y StartFaceSearch, y se envía una notificación de finalización a un tema SNS. Tras la finalización, se obtienen los resultados con la API Get correspondiente. Los resultados incluyen marcas de tiempo por fotograma, permitiendo saber con precisión en qué momento del video se detectó cada elemento. Los formatos de video compatibles son MOV y MP4 con codificación H.264, con un tamaño máximo de archivo de 10 GB y una duración máxima de 6 horas.
Implementación de moderación de contenido
En plataformas UGC (contenido generado por usuarios), es necesario verificar automáticamente si los videos subidos por los usuarios contienen contenido inapropiado. Se construye un pipeline que activa Lambda con la carga de video en S3, llama a StartContentModeration, detecta la finalización mediante notificación SNS y evalúa los resultados. Los resultados de detección incluyen categorías de contenido inapropiado (Explicit Nudity, Violence, Visually Disturbing, etc.) y puntuaciones de confianza. Se establece un umbral de confianza y se diseña un flujo de trabajo que automáticamente oculta los videos con detecciones por encima del umbral o los envía a una cola de revisión humana.
Búsqueda facial y detección de segmentos
Al registrar previamente imágenes faciales en una colección de rostros, StartFaceSearch puede detectar escenas en el video donde aparecen rostros registrados. Se puede utilizar para buscar escenas de aparición de actores en empresas de medios o para rastrear personas específicas con fines de seguridad. La detección de segmentos (StartSegmentDetection) es una función que analiza la estructura del video, identificando automáticamente límites de toma (cambios de cámara), fotogramas negros, barras de color, pizarras, logotipos de estudio y créditos finales. Es efectiva para la automatización de edición de video en emisoras y servicios de streaming, y para la detección de puntos de inserción de publicidad. Para comprender el diseño de modelos de moderación de contenido, los libros relacionados (Amazon) son una buena referencia.
Precios de Rekognition Video
Los precios de Rekognition Video API se basan en los minutos de video procesados. La moderación de contenido cuesta aproximadamente 0,12 dólares por minuto, la detección de etiquetas aproximadamente 0,10 dólares y la búsqueda facial aproximadamente 0,10 dólares. La moderación de contenido de un video de 10 minutos cuesta aproximadamente 1,20 dólares. Para plataformas UGC que procesan grandes volúmenes de video, es efectivo optimizar estableciendo umbrales de confianza apropiados para reducir análisis innecesarios y sustituyendo videos cortos (menos de 30 segundos) por la Image API con imágenes en miniatura.
Resumen
Rekognition Video API es un servicio que permite el análisis automático de contenido de video de forma serverless. Garantiza la seguridad de plataformas UGC con moderación de contenido y automatiza flujos de trabajo de medios con búsqueda facial y detección de segmentos. Combinando S3 y Lambda en una arquitectura dirigida por eventos, se puede automatizar completamente el proceso desde la carga del video hasta la finalización del análisis.