AWS Clean Rooms ML 新服务2023年〜
在 Clean Rooms 中保护隐私的同时构建 ML 模型的服务
它能做什么
AWS Clean Rooms ML 是一项允许多家企业在不直接共享各自数据的情况下共同构建机器学习模型的服务。各公司的数据在隐私受保护的状态下用于分析,原始数据不会向其他公司公开。可以安全地实现广告效果预测和受众相似模型(Lookalike Model)创建等数据协作。
使用场景
用于广告主和发布商在不直接共享各自客户数据的情况下提高广告定向精度。还用于零售商和制造商安全地组合购买数据构建需求预测模型,以及金融机构之间共同训练欺诈检测模型等场景。
日常类比
想象多家公司共同做一道菜的场景。各公司不想让其他公司看到自己的秘方(数据)。Clean Rooms ML 的机制是,各公司将食材放入密封的盒子中交出,只有机器人厨师(ML 模型)使用盒子里的内容完成料理。完成的料理(分析结果)所有人都能获得,但其他公司的秘方对任何人都不可见。
什么是 Clean Rooms ML
AWS Clean Rooms ML 是扩展 AWS Clean Rooms 功能、在保护隐私的同时构建机器学习模型的服务。传统上,多家企业要组合数据创建 ML 模型,需要将数据集中到一处。Clean Rooms ML 无需移动或共享各公司的数据,即可在安全环境中执行 ML 模型的训练和推理。
Lookalike Model 的应用
Clean Rooms ML 的代表性功能是 Lookalike Model(相似受众模型)。例如,广告主可以基于自己的优质客户列表,从发布商的用户群中找出具有相似特征的用户。广告主的客户数据和发布商的用户数据都不会相互公开,在隐私得到保护的情况下实现高精度定向。
隐私保护机制
Clean Rooms ML 利用差分隐私和加密技术来保护单条记录不被识别。可以预先设置协作规则(哪些数据可以在什么范围内使用),违反规则的查询或分析会被自动阻止。数据所有者始终保持对自己数据的控制权。 要更深入地了解隐私保护机制,也可以参考专业书籍(Amazon)。
开始使用
要开始使用 Clean Rooms ML,首先在 AWS Clean Rooms 中创建协作,定义参与成员和数据使用规则。然后在 Clean Rooms ML 设置中选择 ML 模型类型(如 Lookalike Model),指定训练数据源。模型训练完成后,可以导出结果用于营销活动。
注意事项
- Clean Rooms ML 是 AWS Clean Rooms 的附加功能,需要先完成 Clean Rooms 的协作设置
- Lookalike Model 的精度取决于训练数据的数量和质量,请确保有足够的数据量
- 可用区域有限,请提前确认支持的区域