Amazon Personalize

基于机器学习提供实时个性化推荐的全托管服务,无需 ML 专业知识即可实现商品推荐和内容个性化

概述

Amazon Personalize 是一项利用与 Amazon.com 相同的机器学习技术提供实时个性化推荐的全托管服务。只需准备用户行为数据(点击、购买、浏览等)、商品元数据和用户属性,即可自动训练推荐模型并通过 API 提供实时推荐。支持商品推荐、个性化排名、相关商品等多种推荐场景,无需 ML 专业知识即可实现高质量推荐。

数据集与解决方案配方

Personalize 使用三种数据集:交互数据集(用户行为历史)、商品数据集(商品元数据)和用户数据集(用户属性)。其中交互数据集是必须的,至少需要 1000 条交互记录和 25 个唯一用户。解决方案配方(Recipe)是预定义的 ML 算法,根据用例选择。User-Personalization 配方适合为每个用户推荐商品,Similar-Items 配方适合查找相似商品,Personalized-Ranking 配方适合对现有列表进行个性化重排序。配方选择后,Personalize 自动执行特征工程、超参数优化和模型训练。训练完成后创建 Campaign(推理端点),通过 GetRecommendations API 获取实时推荐。

实时事件与推荐质量优化

Personalize 的 Event Tracker 实时接收用户行为事件,立即反映到推荐结果中。例如用户浏览了某商品后,下次推荐会考虑该浏览行为。这种实时个性化对于新用户(冷启动)尤为重要。过滤器功能可排除已购买商品、缺货商品或不符合年龄限制的商品。推荐质量优化方面,定期用新数据重新训练模型(增量训练)保持推荐的新鲜度。A/B 测试通过同时运行多个 Campaign 比较推荐效果。指标方面,覆盖率(推荐了多少比例的商品)和多样性与精确度的平衡是关键。

架构设计与成本优化

典型架构是前端通过 API GatewayLambda 调用 Personalize API,将推荐结果缓存到 ElastiCache 以降低延迟和成本。批量推荐使用 Batch Inference Job 一次性为所有用户生成推荐,适合邮件营销等离线场景。成本由数据摄入、训练和推理三部分组成。推理成本按 TPS(每秒事务数)计费,最低 1 TPS 起。成本优化的关键是根据实际流量调整 Campaign 的最小 TPS,非高峰时段降低 TPS。对于流量波动大的场景,自动扩缩容会根据实际请求量调整容量。与 CloudFront 结合的边缘缓存可进一步降低对 Personalize API 的直接调用次数。

共有するXB!