Detección automática de datos confidenciales en S3 con Amazon Macie - Detección de PII y gestión de la postura de seguridad de datos

Se explica la detección de datos confidenciales en buckets S3 con Macie, los identificadores de datos personalizados y la integración con Security Hub.

約 7 分で読めます最終更新: 2026-05-10

Descripción general de Macie

Macie es un servicio de seguridad de datos que detecta y clasifica automáticamente los datos confidenciales en los buckets S3. Evalúa automáticamente "en qué buckets S3 se almacenan datos confidenciales" y "si la configuración de seguridad de esos buckets es adecuada". Detecta PII y números de tarjetas de crédito con más de 100 identificadores de datos gestionados, y también admite datos confidenciales específicos de la organización con identificadores personalizados. Con la integración de Organizations, la cuenta de administración puede escanear centralmente los buckets S3 de todas las cuentas miembro, consolidando la carga operativa incluso en entornos con cientos de cuentas.

Detección de datos y postura de seguridad

Los trabajos de detección de datos confidenciales escanean los objetos de los buckets S3 mediante muestreo o escaneo completo, detectando PII con identificadores de datos gestionados. También es compatible con nombres, direcciones, números de teléfono y números de identificación nacional en japonés. Los identificadores de datos personalizados se definen combinando expresiones regulares (por ejemplo, patrones de números de empleado) y palabras clave (por ejemplo, "confidencial"). El inventario de buckets S3 permite verificar la configuración de cifrado y el bloqueo de acceso público de todos los buckets, identificando los buckets de alto riesgo. La severidad de los hallazgos se clasifica automáticamente: "HIGH" para datos como números de tarjetas de crédito o pasaportes que pueden ser explotados inmediatamente, y "MEDIUM" para datos como direcciones de correo electrónico que por sí solos difícilmente causan daño directo.

Detección automática y clasificación

La detección automática de datos confidenciales de Macie realiza un escaneo de muestreo continuo de todos los buckets S3 de la cuenta, estimando la presencia de datos confidenciales. En comparación con los trabajos de escaneo completo, el costo es menor y es adecuada para comprender la distribución de datos confidenciales en toda la organización. Los identificadores de datos gestionados detectan más de 100 patrones de datos confidenciales (números de tarjetas de crédito, números de seguridad social, números de pasaporte, claves API). Con los identificadores de datos personalizados se pueden definir patrones específicos de la organización. Las listas de permitidos suprimen falsos positivos excluyendo datos de prueba e información pública. Para profundizar en seguridad de datos, libros especializados en Amazon son un recurso útil.

Casos de uso y cumplimiento normativo

Macie es especialmente potente para el cumplimiento de GDPR, PCI DSS y leyes de protección de datos. El artículo 30 del GDPR exige "registros de actividades de procesamiento", obligando a las organizaciones a saber siempre dónde se almacenan los datos personales. Al habilitar la detección automática de Macie, se detectan continuamente los datos personales recién cargados en S3, manteniendo la actualización del mapeo de datos. PCI DSS requiere la gestión estricta de las ubicaciones de almacenamiento de números de tarjeta (PAN), y los identificadores gestionados de Macie detectan patrones de números de tarjeta para alertar sobre fugas inesperadas a buckets no previstos. También se puede aplicar a la catalogación de datos al construir data lakes - combinando con Lake Formation para etiquetar automáticamente columnas sensibles y aplicar control de acceso a nivel de columna es un patrón efectivo.

Mejores prácticas operativas y errores comunes

El error más común en la etapa inicial de implementación de Macie es ejecutar trabajos de escaneo completo en todos los buckets simultáneamente, generando costos inesperados. El enfoque recomendado es un proceso de dos etapas: primero habilitar la detección automática de datos confidenciales (basada en muestreo) para comprender la distribución general, y luego programar trabajos de escaneo completo solo para los buckets con puntuaciones de descubrimiento altas. El diseño de listas de permitidos también es crítico: sin excluir datos ficticios de entornos de prueba o claves API públicas, los falsos positivos masivos provocan fatiga de alertas. Para el diseño de acciones de EventBridge, responda proporcionalmente según la severidad: HIGH requiere bloqueo inmediato del acceso público e integración automática con Security Hub; MEDIUM implica notificación al equipo de seguridad con revisión en 48 horas; LOW se agrega en informes semanales. Excluir buckets de logs de CloudTrail y logs de acceso de ALB (que contienen direcciones IP pero son de baja sensibilidad) del alcance del escaneo reduce tanto el ruido como el costo.

Precios de Macie

Los precios de Macie se componen de la evaluación de buckets (aproximadamente 0,10 USD/mes por bucket) y la detección de datos confidenciales (volumen de datos escaneados, aproximadamente 1 USD por GB). La detección automática de datos confidenciales se basa en muestreo y es significativamente más económica que el escaneo completo. Se puede confirmar el costo real con la prueba gratuita de 30 días. Gestione los costos limitando los objetivos de escaneo a buckets con alta probabilidad de contener datos confidenciales, excluyendo los buckets de logs y backups. Los hallazgos se agregan en Security Hub sin cargo adicional. En entornos de gran escala donde los buckets alcanzan miles, solo la evaluación de buckets puede costar cientos de dólares mensuales, por lo que es efectivo reducir las cuentas objetivo usando la función de administrador delegado de Organizations.

Resumen

La implementación de Macie comienza activando la detección automática de datos confidenciales para realizar un escaneo de muestreo de todos los buckets S3 de la cuenta y comprender la distribución de datos confidenciales. Se priorizan los buckets de alto riesgo (acceso público habilitado, sin cifrado) para el escaneo completo, y se construye una respuesta automática a los resultados de detección mediante la integración con EventBridge (bloqueo de acceso público, notificación al equipo de seguridad). Es especialmente efectivo para el cumplimiento del GDPR y las leyes de protección de datos personales.

Detección de permisos excesivos con IAM Access Analyzer - Análisis de acceso externo y permisos no utilizadosDetecta permisos no utilizados en roles IAM mediante análisis basado en CloudTrail y genera automáticamente políticas de mínimo privilegio. Cubre la detección de acceso externo y la integración de verificaciones de políticas personalizadas en pipelines CI/CD.Automatización de la gestión de certificados SSL/TLS con AWS Certificate Manager - Desde la emisión hasta la rotaciónExplicamos la emisión gratuita de certificados públicos con ACM, la validación DNS, la renovación automática y el despliegue en ALB y CloudFront.Obtención de informes de cumplimiento con AWS Artifact - Respuesta a auditorías y gestión de contratosPresenta cómo obtener informes de auditoría SOC, PCI DSS e ISO bajo demanda, y aplicar BAA y GDPR DPA de forma masiva a toda la organización con Organizations.Automatización de auditorías - Recopilación continua de evidencias de cumplimiento con AWS Audit ManagerExplica la recopilación automática de evidencias de auditoría con AWS Audit Manager. Presenta la evaluación automática basada en frameworks (SOC 2, PCI DSS, GDPR, etc.), gestión centralizada de evidencias y generación de informes de auditoría.La estructura oculta de los 12 dígitos del ID de cuenta de AWS - Por qué son 12 dígitos y qué se puede inferirUna exploración curiosa de por qué los ID de cuenta de AWS son números de 12 dígitos, la intención de diseño incorporada en la estructura ARN, y las consideraciones de seguridad sobre lo que se puede inferir a partir de un ID de cuenta.Por qué el usuario root de una cuenta AWS es peligroso - Filosofía de diseño de separación de privilegios y práctica de selladoExplicamos por qué el usuario root de AWS tiene privilegios que IAM no puede restringir, la lista de operaciones que solo el usuario root puede realizar, cómo configurar MFA y la estrategia de sellado mediante la gestión de acceso root de Organizations.Gestión de certificados y HTTPS - Operaciones automatizadas de certificados TLS con AWS Certificate ManagerAprenda sobre la emisión de certificados TLS/SSL, renovación automática y despliegue usando AWS Certificate Manager (ACM). Cubre la integración con CloudFront, ALB y API Gateway, validación DNS y uso de Private CA.Gestión dedicada de claves con AWS CloudHSM - Cifrado compatible con FIPS 140-2 Level 3Logre gestión de claves compatible con FIPS 140-2 Level 3 con instancias HSM dedicadas. Aprenda cuándo elegir CloudHSM sobre KMS y cómo integrar ambos mediante almacenes de claves personalizados de KMS.

Descripción general de Macie

Detección de datos y postura de seguridad

Detección automática y clasificación

Casos de uso y cumplimiento normativo

Mejores prácticas operativas y errores comunes

Precios de Macie

Resumen

Servicios relacionados

Artículos relacionados

Más sobre este tema

Artículos y servicios similares