Construcción de aplicaciones RAG con Amazon Bedrock Knowledge Bases - Implementación de generación aumentada por recuperación

Indexe automáticamente documentos en S3 y unifique búsqueda y generación con la API RetrieveAndGenerate. Cubre la selección de estrategia de chunking y la seguridad con Guardrails.

El patrón RAG y descripción general de Knowledge Bases

RAG (Retrieval-Augmented Generation) es un patrón que complementa las respuestas de modelos de lenguaje grande (LLM) con conocimiento externo. Los LLM por sí solos no pueden responder con información actualizada no incluida en sus datos de entrenamiento ni con datos internos de la empresa. RAG resuelve esto recuperando primero documentos relevantes de una base de conocimiento y luego generando respuestas basadas en esos documentos. Amazon Bedrock Knowledge Bases proporciona este patrón RAG como servicio gestionado, automatizando la indexación de documentos, la búsqueda vectorial y la generación de respuestas.

Fuentes de datos y estrategias de chunking

Se especifica un bucket S3 como fuente de datos, y documentos en formatos PDF, HTML, Markdown, Word, CSV se indexan automáticamente. Los documentos se dividen en chunks (fragmentos), y cada chunk se convierte en un vector de embeddings para almacenarse en un almacén vectorial. Las estrategias de chunking incluyen: tamaño fijo (dividir por número de caracteres), chunking semántico (dividir por significado del contenido) y chunking jerárquico (mantener la estructura del documento). El chunking semántico generalmente proporciona los mejores resultados de recuperación al mantener la coherencia del contenido dentro de cada chunk.

Uso de APIs e integración con Guardrails

La API RetrieveAndGenerate recibe texto de consulta y ejecuta la búsqueda de documentos relevantes y la generación de respuestas por LLM en una sola llamada API. La respuesta incluye la respuesta generada y las citas de los documentos fuente utilizados. La API Retrieve permite realizar solo la búsqueda sin generación, útil cuando se desea control sobre el prompt de generación. Bedrock Guardrails se integra para filtrar contenido inapropiado, bloquear temas sensibles y aplicar filtros de información personal en las respuestas generadas.

Precios de Knowledge Bases

Los precios de Knowledge Bases se componen de indexación de documentos (vectorización) y consultas. La vectorización usa el modelo de embeddings seleccionado (Titan Embeddings V2 a aproximadamente 0.00002 dólares por 1,000 tokens). El almacén vectorial (OpenSearch Serverless) tiene un costo base de aproximadamente 0.24 dólares por hora por OCU. Las consultas incurren en costos del modelo de embeddings para la búsqueda y del modelo de generación (Claude, Titan, etc.) para la respuesta. Para cargas de trabajo de bajo volumen, el costo principal es el almacén vectorial.

Resumen

Bedrock Knowledge Bases es un servicio que implementa el patrón RAG de forma gestionada. Indexa automáticamente documentos en S3, unifica búsqueda y generación con la API RetrieveAndGenerate, y proporciona citas de fuentes para verificabilidad. La selección de estrategia de chunking impacta directamente en la calidad de recuperación, y la integración con Guardrails asegura respuestas seguras en producción. Es la forma más rápida de construir aplicaciones de IA generativa basadas en conocimiento empresarial en AWS.