Búsqueda inteligente - Búsqueda transversal de conocimiento interno con Amazon Kendra
Aprenda a construir búsqueda empresarial con Amazon Kendra. Cubre consultas en lenguaje natural, conectores de fuentes de datos, integración con RAG (Generación Aumentada por Recuperación) y cuándo elegir Kendra frente a OpenSearch.
Desafíos de la búsqueda empresarial y posicionamiento de Kendra
El conocimiento empresarial está disperso en numerosos sistemas: S3, SharePoint, Confluence, wikis internos, sitios de FAQ y bases de datos. La búsqueda tradicional por palabras clave requiere que los usuarios conozcan los términos de búsqueda correctos y no puede manejar preguntas en lenguaje natural como "¿Cómo solicito vacaciones pagadas?". Amazon Kendra es un servicio de búsqueda inteligente basado en ML que admite más de 40 conectores de fuentes de datos y 14 idiomas, comprende preguntas en lenguaje natural y extrae respuestas directamente de los documentos. Por ejemplo, ante la pregunta "¿Hasta cuándo deben completar los nuevos empleados su examen médico?", Kendra identifica la sección relevante en un PDF de políticas internas y presenta la respuesta. Mientras que OpenSearch (basado en Elasticsearch) destaca en la coincidencia de palabras clave mediante índices invertidos y agregación/análisis, Kendra se especializa en búsqueda semántica impulsada por comprensión del lenguaje natural (NLU) y aprendizaje automático. OpenSearch para ingenieros que realizan análisis de logs y búsqueda de métricas, y Kendra para usuarios de negocio no técnicos que buscan conocimiento interno: ambos son complementarios.
Conectores de fuentes de datos y construcción de índices
Kendra proporciona más de 40 conectores de fuentes de datos listos para usar, permitiendo conexiones sin código a las principales fuentes de datos. Las fuentes compatibles incluyen S3 (PDF, Word, HTML, texto), RDS/Aurora (columnas de texto en bases de datos), SharePoint Online, Confluence, Salesforce, ServiceNow, Google Drive, OneDrive, Slack y GitHub. Las API de conectores personalizados permiten integrar fuentes de datos propietarias también. La sincronización de fuentes de datos se ejecuta según un programa configurable (cada hora, diariamente, semanalmente), reflejando automáticamente documentos nuevos, actualizados y eliminados en el índice. La función de importación automática de ACL (Lista de Control de Acceso) extrae permisos de acceso directamente de fuentes de datos como SharePoint y Confluence, de modo que esos permisos se aplican de forma transparente a los resultados de búsqueda de Kendra. Los documentos para los que el Usuario A no tiene permiso de visualización no aparecerán en sus resultados de búsqueda. Este control de acceso transparente es una función crítica para entornos empresariales con requisitos de seguridad estrictos.
Funciones de búsqueda e integración con RAG
Kendra devuelve resultados de búsqueda en tres tipos. Suggested Answer extrae una respuesta directa de un documento con el pasaje relevante resaltado. FAQ Answer devuelve respuestas de una base de datos de FAQ previamente registrada. Document devuelve una lista de documentos altamente relevantes, similar a los resultados de búsqueda tradicionales. Para el ajuste de búsqueda, puede configurar el impulso de campos (ponderación de campos de metadatos específicos), búsqueda por facetas (filtrado por categoría, fecha, autor) y diccionarios de sinónimos (tesauro). Kendra puede servir como recuperador en el patrón RAG (Generación Aumentada por Recuperación) de Bedrock. Kendra busca documentos relevantes en respuesta a la pregunta de un usuario, luego pasa esos documentos como contexto a un LLM de Bedrock, generando respuestas precisas basadas en el conocimiento interno. Los resultados de búsqueda de alta precisión de Kendra mejoran directamente la calidad de las respuestas de RAG. Para comprender el diseño del modelo de Kendra, los libros relacionados (Amazon) pueden ser útiles.
Precios y selección de edición
Kendra ofrece dos ediciones: Developer Edition y Enterprise Edition. Developer Edition cuesta 1,125 USD por hora (aproximadamente 810 USD/mes) y admite hasta 5 índices, 40.000 documentos y 4.000 consultas por día. Es adecuada para entornos de desarrollo/pruebas y búsqueda interna a pequeña escala. Enterprise Edition cuesta 1,40 USD por hora (aproximadamente 1.008 USD/mes) y admite hasta 5 índices, 500.000 documentos y 8.000 consultas por día, con alta disponibilidad (multi-AZ). Se puede adquirir almacenamiento de documentos y capacidad de consultas adicionales bajo demanda. Para reducir costos, puede controlar el tiempo de actividad del índice deteniéndolo durante noches y fines de semana. Comparado con OpenSearch Serverless, Kendra ofrece una precisión superior en búsqueda de lenguaje natural pero a un costo más alto. Si los objetivos de búsqueda son datos de logs estructurados, OpenSearch es la mejor opción; para documentos internos no estructurados, Kendra es la elección racional.
Resumen - Directrices para usar Kendra
Amazon Kendra es un servicio de búsqueda inteligente que realiza búsquedas transversales del conocimiento interno utilizando comprensión del lenguaje natural basada en ML. Sus principales fortalezas son más de 40 conectores de fuentes de datos, control de acceso transparente mediante ACL, funcionalidad de FAQ e integración RAG con Bedrock. Es más efectivo en escenarios donde la recuperación de información es un cuello de botella empresarial: reducir consultas al helpdesk interno, mejorar la eficiencia de la gestión del conocimiento y mejorar la calidad de las respuestas del soporte al cliente. Recomendamos comenzar a pequeña escala con Developer Edition, validar los resultados y luego escalar a Enterprise Edition.