对话式机器人构建 - 使用 Amazon Lex 和 Polly 实现自然的会话界面
详解使用 Amazon Lex 和 Amazon Polly 构建对话式机器人的方法。
对话式机器人的需求与 AWS 的会话 AI 服务
客户支持自动化、内部帮助台、预约系统、FAQ 应答等对话式机器人的应用正在迅速扩展。Gartner 预测到 2027 年超过 25% 的客户服务将以聊天机器人为主要渠道。AWS 以 Amazon Lex 和 Amazon Polly 为核心提供会话 AI 服务来解决这些课题。此外,Lex 与 Amazon Connect 的集成可实现电话渠道的自动应答,与 Amazon Kendra 的集成可实现基于知识库的智能问答。
Amazon Lex 的对话流程设计
Amazon Lex V2 通过意图(用户意图)、槽位(参数)和履行(处理执行)三个概念设计对话流程。例如酒店预约机器人中,为 BookHotel 意图定义入住日期、退房日期、房间类型、人数等槽位,所有槽位填满后通过 Lambda 函数执行预约处理。Lex V2 支持多轮对话,可根据上下文动态切换对话流程。条件分支功能可根据槽位值改变后续对话。
Amazon Polly 的自然语音合成
Amazon Polly 是利用深度学习技术的文本转语音(TTS)服务,提供 30 多种语言、100 多种声音。Neural TTS 引擎相比传统 Standard 引擎生成更自然、更接近人类的语音。日语提供 Mizuki(女性)和 Takumi(男性)的 Neural 语音,还支持新闻播报风格。SSML 标记可精细控制语速、音调、停顿和强调。语音标记功能输出音素级别的时间信息,可用于唇形同步动画。
实践用例与集成模式
Lex 和 Polly 的组合可应对多样的用例。客户支持中,FAQ 应答机器人自动回答常见问题,仅将复杂咨询升级给座席的配置非常有效。Lex 的情感分析功能可检测用户情感(正面、负面、中性),检测到负面情感时优先转接座席的智能路由可提升客户满意度。与 Connect 集成可构建电话渠道的语音机器人,与 Kendra 集成可实现基于企业知识库的智能问答。 关于聊天机器人开发的详细信息,可参考相关书籍 (Amazon)。
Lex 和 Polly 的费用
Lex 按请求数计费。语音请求每 1,000 次约 4.00 美元,文本请求每 1,000 次约 0.75 美元。Polly Standard 语音每 100 万字符约 4.00 美元,Neural 语音约 16.00 美元。免费套餐中 Lex 前 12 个月每月语音 10,000 次、文本 10,000 次。Polly 前 12 个月每月 Standard 500 万字符、Neural 100 万字符免费。
总结 - 对话式机器人构建的最优解
Lex V2 的多轮对话、条件分支、情感分析全面提供了构建实用机器人所需的功能。Polly 的 Neural TTS 生成接近人类的自然语音,大幅提升语音对话体验的质量。通过 Lambda 的无服务器后端集成、与 Connect 的电话渠道集成、与 Kendra 的知识库搜索集成,可构建从简单 FAQ 机器人到企业级客户服务自动化的各种解决方案。