智能搜索 - 通过 Amazon Kendra 跨系统搜索企业知识
解析如何使用 Amazon Kendra 构建企业搜索。介绍自然语言查询、数据源连接器、RAG(检索增强生成)集成、与 OpenSearch 的选型对比。
企业搜索的挑战与 Kendra 的定位
企业内的知识分散在 S3、SharePoint、Confluence、内部 Wiki、FAQ 站点、数据库等众多系统中。传统关键词搜索要求用户知道合适的搜索词,无法应对自然语言问题。Amazon Kendra 是基于 ML 的智能搜索服务,通过 40 多个数据源连接器整合企业内信息,以自然语言理解返回精确答案。
数据源连接器与索引构建
Kendra 标准提供 40 多个数据源连接器,可无代码完成与主要数据源的连接。支持 S3(PDF、Word、HTML、文本)、RDS/Aurora(数据库文本列)、SharePoint Online、Confluence、Salesforce、ServiceNow、Google Drive、OneDrive、Slack、GitHub 等。连接器定期爬取数据源并自动更新索引。支持 ACL 的连接器会根据用户权限过滤搜索结果。
搜索功能与 RAG 集成
Kendra 的搜索结果以三种类型返回。Suggested Answer 是从文档中提取的直接回答,高亮显示相关段落。FAQ Answer 是从预注册 FAQ 数据库中的回答。Document 是相关度高的文档列表,相当于传统搜索结果。搜索调优支持字段提升(特定元数据字段的权重调整)和用户反馈学习。与 Bedrock 集成可构建基于企业文档的 RAG 应用。
费用与版本选择
Kendra 提供 Developer Edition 和 Enterprise Edition 两个版本。Developer Edition 每小时 1.125 USD(约 810 USD/月),最多 5 个索引、40,000 文档、每天 4,000 次查询。适合开发验证环境或小规模内部搜索。Enterprise Edition 每小时 1.40 USD(约 1,008 USD/月),最多 5 个索引、100,000 文档、每天 8,000 次查询。
总结 - Kendra 使用指南
Amazon Kendra 是通过基于 ML 的自然语言理解跨系统搜索企业知识的智能搜索服务。40 多个数据源连接器、ACL 透明访问控制、FAQ 功能、与 Bedrock 的 RAG 集成是其主要优势。适用于减少内部帮助台咨询、提高知识管理效率、提升客户支持回答质量等信息检索成为业务瓶颈的场景。