Amazon SageMaker 热门2017年〜
覆盖机器学习全生命周期的综合平台
它能做什么
Amazon SageMaker 是一项覆盖机器学习全生命周期(数据准备、模型训练、调优、部署、监控)的全托管平台。提供 Jupyter Notebook 环境、内置算法、分布式训练、自动模型调优、一键部署等功能。支持从实验到生产的无缝过渡。
使用场景
用于自定义 ML 模型的开发和训练、大规模分布式训练、模型的 A/B 测试和部署、MLOps 管道的构建、计算机视觉和自然语言处理模型的开发。
日常类比
可以比作 ML 工程师的完整工作台。从原材料加工(数据准备)到产品制造(模型训练)、质量检验(评估)、出货(部署)的所有工具都齐备在一个工作台上。
什么是 SageMaker
Amazon SageMaker 是 AWS 的机器学习平台。提供 ML 工作流各阶段所需的工具:SageMaker Studio(IDE)、Data Wrangler(数据准备)、Training(模型训练)、Experiments(实验管理)、Model Registry(模型注册)、Endpoints(推理端点)、Pipelines(MLOps)等。
训练与部署
SageMaker 的训练作业在托管的计算实例上运行,训练完成后自动释放资源。支持单实例到数千 GPU 的分布式训练。训练好的模型可以部署为实时推理端点、批量转换作业或异步推理端点。自动扩缩容根据流量调整端点实例数。 如需深入了解训练与部署的知识,可参考专业书籍(Amazon)。
开始使用
在 SageMaker 控制台创建 Studio 域,启动 Notebook 实例。使用内置算法或自定义训练脚本创建训练作业。训练完成后创建模型并部署到端点。SageMaker JumpStart 提供预训练模型和解决方案模板,可以快速开始。
注意事项
- 训练作业完成后实例自动释放,只按实际训练时间收费
- SageMaker JumpStart 提供预训练模型和解决方案模板,可以快速开始