生成式 AI 平台 - 通过 Amazon Bedrock 构建企业级 AI 基础设施

介绍利用 Amazon Bedrock 构建生成式 AI 应用程序的方法,包括基础模型选择、RAG 模式实现、通过 Guardrails 确保安全性以及与 SageMaker 的集成等企业级 AI 基础设施设计。

生成式 AI 的挑战与 Bedrock 的定位

将生成式 AI 集成到企业应用程序中面临基础模型选择、基础设施构建、安全保障和成本管理等诸多挑战。自行托管大语言模型 (LLM) 需要 GPU 实例采购、模型优化、推理端点扩展和模型版本管理。Amazon Bedrock 是解决这些挑战的完全托管生成式 AI 服务,通过统一 API 提供 Anthropic Claude、Meta Llama、Amazon Titan 等多个基础模型的访问。

RAG 模式与 Knowledge Bases

Bedrock 的 Knowledge Bases 功能以完全托管方式实现检索增强生成 (RAG) 模式。RAG 是提高基础模型回答精度的方法,从外部数据源检索与用户问题相关的信息,并将其作为上下文提供给模型。Knowledge Bases 自动对存储在 S3 中的文档(PDF、Word、HTML、文本)进行分块、向量化并存储到向量数据库中。查询时自动执行语义搜索,将相关文档作为上下文传递给模型。

Guardrails 与模型定制

Bedrock Guardrails 是确保生成式 AI 应用程序安全性的综合控制功能。通过内容过滤器可阻止暴力、歧视、色情内容等不当输入输出。定义拒绝主题可限制特定话题(竞争对手信息、投资建议等)的回答。个人信息 (PII) 检测和脱敏功能可自动检测并屏蔽姓名、电话号码、电子邮件地址等敏感信息。通过微调和持续预训练可将模型定制为特定领域。

通过 Agents 和 SageMaker 集成构建应用程序

Bedrock Agents 是一项为基础模型赋予访问外部工具和数据源能力的功能,可构建自主执行复杂任务的 AI 代理。代理理解自然语言指令,分解任务并自动执行必要的 API 调用和数据检索。例如,针对客户咨询,从 CRM 系统获取客户信息,在订单管理系统确认订单状态,并生成适当的回答。与 SageMaker 的集成可将自定义训练的模型导入 Bedrock 并通过统一 API 提供服务。

Bedrock 的定价

Bedrock 按各模型的输入输出 Token 数计费。Claude 3 Haiku 输入每 1,000 Token 约 0.00025 美元,输出约 0.00125 美元。Claude 3.5 Sonnet 输入约 0.003 美元,输出约 0.015 美元。通过 Provisioned Throughput 预留模型单元,可获得稳定延迟和折扣价格。Knowledge Bases 的向量数据库(OpenSearch Serverless)费用另行产生。

总结 - 生成式 AI 平台的选择

Amazon Bedrock 是一项通过统一 API 使用多个基础模型的完全托管生成式 AI 服务。通过 Knowledge Bases 实现 RAG 模式、通过 Guardrails 确保安全性、通过 Agents 实现自主任务执行、通过与 SageMaker 集成整合自定义模型,全面覆盖企业级 AI 应用程序构建所需的功能。