Unificación de identidad de clientes - Resolución de entidades de datos de clientes dispersos con AWS Entity Resolution

Resolución de entidades (name matching) de datos de clientes con AWS Entity Resolution. Matching basado en ML, matching basado en reglas, protección de privacidad e integración con Clean Rooms.

El desafío de la resolución de identidad de clientes

Los datos de clientes empresariales están dispersos en múltiples sistemas como CRM, sitios de comercio electrónico, centros de llamadas y herramientas de marketing. El mismo cliente está registrado con diferentes notaciones en diferentes sistemas (por ejemplo, "John Smith" y "J. Smith", "123 Main St" y "123 Main Street"), y vincularlos como la misma persona (resolución de entidades) ha sido un desafío de larga data. Tradicionalmente era necesario implementar lógica de coincidencia exacta o fuzzy matching por cuenta propia, pero la variedad de patrones de variación hacía difícil lograr tanto precisión como cobertura. AWS Entity Resolution es un servicio administrado que realiza la resolución de entidades de datos de clientes mediante matching basado en ML o reglas.

Métodos de matching y configuración

Entity Resolution ofrece dos métodos de matching. El ML matching utiliza modelos ML de AWS que evalúan integralmente atributos como nombre, dirección, teléfono y correo electrónico para calcular la probabilidad de ser la misma entidad. Procesa automáticamente variaciones de notación, abreviaturas y diferencias de formato, eliminando la necesidad de definir reglas. El matching basado en reglas define reglas de negocio para un control preciso. Por ejemplo, combinando condiciones como "coincidencia exacta de correo electrónico AND similitud de nombre superior al 80%" o "coincidencia de teléfono AND coincidencia de prefectura en dirección". Los datos de entrada se referencian desde fuentes de datos en S3 a través de Glue Data Catalog. El mapeo de esquema asocia las columnas de datos de entrada con los tipos de atributos de Entity Resolution (nombre, dirección, teléfono, correo electrónico, etc.).

Casos de uso e integración con Clean Rooms

Los principales casos de uso son: integración de clientes de marketing (unificar datos de clientes de múltiples canales para construir una vista de 360 grados del cliente), detección de fraude (detectar que diferentes cuentas pertenecen a la misma persona) y limpieza de datos (detección y consolidación de registros duplicados). La integración con Clean Rooms permite ejecutar la resolución de entidades sin compartir datos entre organizaciones. Por ejemplo, un anunciante y un publisher pueden identificar clientes comunes sin revelar sus datos de clientes mutuamente, midiendo la efectividad publicitaria. Los precios son 0.25 USD por 1,000 registros procesados para ML matching y 0.025 USD para matching basado en reglas. Procesar 1 millón de registros de clientes con ML matching cuesta aproximadamente 250 USD. Para ampliar conocimientos en análisis de datos, libros especializados en Amazon también son útiles.

Precios de Entity Resolution

Los precios de Entity Resolution se facturan por número de registros procesados. El ML matching cuesta aproximadamente $0.25 por 1,000 registros, y el matching basado en reglas aproximadamente $0.25 por 1,000 registros. El mapeo de ID cuesta aproximadamente $0.25 por 1,000 registros. El procesamiento inicial de resolución de entidades es más costoso ya que abarca todos los registros, pero el procesamiento diferencial de solo registros nuevos/actualizados reduce los costos continuos. Al usar con integración de Clean Rooms, se aplican cargos adicionales por consultas de Clean Rooms.

Resumen - Directrices de uso de Entity Resolution

AWS Entity Resolution realiza la resolución de entidades de datos de clientes dispersos como servicio administrado. Sus principales fortalezas son el procesamiento automático de variaciones de notación con ML matching, el control preciso con matching basado en reglas y la protección de privacidad con integración de Clean Rooms. Es adecuado para organizaciones donde los datos de clientes están dispersos en múltiples sistemas y la construcción de una vista unificada del cliente es un desafío.