AWS Clean Rooms のアイコン

AWS Clean Rooms 新服务2023年〜

多家企业无需共享数据即可进行联合分析的隐私保护型数据协作服务

它能做什么

AWS Clean Rooms 是一项隐私保护型服务,允许多家企业或组织在不直接共享原始数据的情况下进行联合数据分析。每位参与者将自己的数据保留在自己的 AWS 账户中,只能执行事先约定的分析规则(查询)。分析结果仅返回聚合值,无法访问单条记录。

使用场景

用于广告主与媒体企业之间的广告效果评估(不共享个人数据即可进行转化分析)、制药公司之间的临床数据联合分析、零售商与制造商之间的购买数据联合营销分析、金融机构之间用于欺诈检测的数据比对等。

日常类比

可以将其比作密封的投票箱。各企业将自己的数据(选票)放入密封的箱子(Clean Rooms)中。箱子内部进行统计(分析),只有结果(聚合值)被取出。谁放入了哪张选票(单条数据)对任何人都不可见。在保护数据隐私的同时,可以把握整体趋势。

什么是 Clean Rooms

AWS Clean Rooms 是一项让多个组织安全地进行数据联合分析的服务。在商业中,经常需要将其他公司的数据与自己的数据结合进行分析。然而,从个人信息保护和数据安全的角度来看,直接共享原始数据非常困难。Clean Rooms 提供了一种不共享数据即可实现联合分析的机制。

协作机制

在 Clean Rooms 中,首先在参与者之间创建“协作”。各参与者将存储在自己 S3 中的数据注册为“已配置表”,并精细控制哪些列用于分析、允许哪些聚合操作(SUM、COUNT、AVG 等)。执行分析的一方只能运行被允许的查询,无法提取单条记录。

隐私保护机制

Clean Rooms 具备多重隐私保护机制。通过分析规则,只能执行被允许的聚合查询。通过输出约束,可以设置聚合结果的最小行数,防止从少量记录中识别个人的风险。此外,使用 Clean Rooms ML 可以应用差分隐私,通过添加统计噪声使个人识别更加困难。 关于隐私保护机制的技术背景,可以参考相关书籍(Amazon)进行学习。

开始使用

在 Clean Rooms 控制台中创建协作并邀请参与者。各参与者将自己的 S3 数据注册为已配置表,并设置分析规则(允许的查询类型、聚合函数、输出约束)。执行分析的参与者运行查询后,会返回符合规则的聚合结果。建议先从公司内部两个部门之间进行测试开始。

注意事项

  • Clean Rooms 的费用基于查询处理的数据量按量计费,数据存储本身不产生额外费用
  • 如果分析规则设置不当,可能导致意外的数据泄露,或者反过来无法进行所需的分析,因此规则设计需要谨慎
  • 所有参与者都需要拥有 AWS 账户,与未使用 AWS 的合作伙伴进行协作需要另行处理
共有するXB!