AWS Entity Resolution のアイコン

AWS Entity Resolution 新服务2023年〜

匹配和整合不同数据源记录的数据匹配服务

它能做什么

AWS Entity Resolution 是匹配和整合分散在不同数据源中的同一实体 (客户、产品等) 记录的服务。即使存在姓名拼写差异或地址不同,也能通过基于规则或机器学习的匹配识别同一记录。

使用场景

适用于整合分散在多个 CRM 系统中的客户数据、营销数据库的去重、合作企业间使用数据洁净室进行安全数据匹配等场景。

日常类比

可以将其比作名册核对工作。在多份名册中以「田中太郎」「たなかタロウ」「T. Tanaka」等不同写法登记的同一人,自动找出并合并为一条记录。

什么是 Entity Resolution

AWS Entity Resolution 是进行数据匹配和整合的服务。当企业拥有多个系统和数据源时,同一客户或产品可能以不同格式注册。Entity Resolution 匹配这些记录,创建统一视图。

匹配方法

Entity Resolution 提供基于规则和基于机器学习两种匹配方法。基于规则的方法定义组合邮箱地址或电话号码等属性的匹配规则。基于机器学习的方法使用 AWS 预训练模型,考虑拼写差异和部分匹配进行匹配。还可与数据提供商服务集成,实现与第三方数据的匹配。 有关匹配方法的详细解说,也可参阅 Amazon 上的解说书籍

入门指南

在 Entity Resolution 控制台创建模式映射,定义输入数据的属性。创建匹配工作流并设置匹配方法和规则,执行作业。结果输出到 S3,可查看匹配的记录组。

注意事项

  • Matching accuracy depends heavily on data quality and matching rule design, so validate with test data before finalizing rules
  • Pricing is based on the number of records processed, and machine learning-based matching costs more per record than rule-based
共有するXB!