Construcción de aplicaciones RAG con Amazon Bedrock Knowledge Bases - Implementación de generación aumentada por recuperación

Indexe automáticamente documentos en S3 y unifique búsqueda y generación con la API RetrieveAndGenerate. Cubre la selección de estrategia de chunking y la seguridad con Guardrails.

約 3 分で読めます最終更新: 2026-02-17

El patrón RAG y descripción general de Knowledge Bases

RAG (Retrieval-Augmented Generation) es un patrón que complementa las respuestas de modelos de lenguaje grande (LLM) con conocimiento externo. Los LLM por sí solos no pueden responder con información actualizada no incluida en sus datos de entrenamiento ni con datos internos de la empresa. RAG resuelve esto recuperando primero documentos relevantes de una base de conocimiento y luego generando respuestas basadas en esos documentos. Amazon Bedrock Knowledge Bases proporciona este patrón RAG como servicio gestionado, automatizando la indexación de documentos, la búsqueda vectorial y la generación de respuestas.

Fuentes de datos y estrategias de chunking

Se especifica un bucket S3 como fuente de datos, y documentos en formatos PDF, HTML, Markdown, Word, CSV se indexan automáticamente. Los documentos se dividen en chunks (fragmentos), y cada chunk se convierte en un vector de embeddings para almacenarse en un almacén vectorial. Las estrategias de chunking incluyen: tamaño fijo (dividir por número de caracteres), chunking semántico (dividir por significado del contenido) y chunking jerárquico (mantener la estructura del documento). El chunking semántico generalmente proporciona los mejores resultados de recuperación al mantener la coherencia del contenido dentro de cada chunk.

Uso de APIs e integración con Guardrails

La API RetrieveAndGenerate recibe texto de consulta y ejecuta la búsqueda de documentos relevantes y la generación de respuestas por LLM en una sola llamada API. La respuesta incluye la respuesta generada y las citas de los documentos fuente utilizados. La API Retrieve permite realizar solo la búsqueda sin generación, útil cuando se desea control sobre el prompt de generación. Bedrock Guardrails se integra para filtrar contenido inapropiado, bloquear temas sensibles y aplicar filtros de información personal en las respuestas generadas.

Precios de Knowledge Bases

Los precios de Knowledge Bases se componen de indexación de documentos (vectorización) y consultas. La vectorización usa el modelo de embeddings seleccionado (Titan Embeddings V2 a aproximadamente 0.00002 dólares por 1,000 tokens). El almacén vectorial (OpenSearch Serverless) tiene un costo base de aproximadamente 0.24 dólares por hora por OCU. Las consultas incurren en costos del modelo de embeddings para la búsqueda y del modelo de generación (Claude, Titan, etc.) para la respuesta. Para cargas de trabajo de bajo volumen, el costo principal es el almacén vectorial.

Resumen

Bedrock Knowledge Bases es un servicio que implementa el patrón RAG de forma gestionada. Indexa automáticamente documentos en S3, unifica búsqueda y generación con la API RetrieveAndGenerate, y proporciona citas de fuentes para verificabilidad. La selección de estrategia de chunking impacta directamente en la calidad de recuperación, y la integración con Guardrails asegura respuestas seguras en producción. Es la forma más rápida de construir aplicaciones de IA generativa basadas en conocimiento empresarial en AWS.

Entrenamiento de machine learning basado en GPU con AWS Batch - Entrenamiento a gran escala con eficiencia de costosEjecute entrenamiento GPU con sus contenedores Docker existentes y reduzca costos hasta un 90% usando instancias Spot y checkpointing. Incluye orientación sobre cuándo elegir Batch sobre SageMaker.Uso de Claude en Amazon Bedrock - Selección de modelos, diseño de prompts y optimización de costosComparamos los modelos Anthropic Claude disponibles en Amazon Bedrock, proporcionamos directrices de selección de modelos por caso de uso y cubrimos mejores prácticas de diseño de prompts y optimización de costos.Primeros pasos con computación cuántica en Amazon Braket - Diseño y simulación de circuitos cuánticosPrototipe gratis con simuladores locales y luego ejecute circuitos cuánticos en hardware IonQ y Rigetti. Cubre la implementación de VQE y QAOA con trabajos híbridos.ML con preservación de privacidad con AWS Clean Rooms ML - Construya modelos sin compartir datosAprenda cómo construir modelos lookalike con Clean Rooms ML, aplicar privacidad diferencial y aprovechar los resultados para segmentación publicitaria.Procesamiento de lenguaje natural con Amazon Comprehend - Análisis de sentimiento y extracción de entidadesExplicamos el análisis de sentimiento, la extracción de entidades y la construcción de modelos de clasificación personalizados con Comprehend.Construcción de bots conversacionales - Interfaces de conversación natural con Amazon Lex y PollyAprenda a construir bots conversacionales utilizando Amazon Lex y Amazon Polly.Extracción de texto de documentos - Procesamiento inteligente de documentos con Amazon TextractExplicamos la extracción automática de texto, tablas y datos de formularios de documentos con Amazon Textract, y la construcción de pipelines de procesamiento de lenguaje natural en combinación con Amazon Comprehend. Presentamos patrones de automatización para procesamiento de facturas y análisis de contratos.Visión por computadora en el borde - Análisis de video con IA en sitio usando AWS PanoramaDespliega modelos de visión por computadora en el Panorama Appliance y analiza en tiempo real las transmisiones de cámaras IP existentes. Aprende patrones de diseño para inferencia en el borde que reducen la latencia y ahorran ancho de banda.

El patrón RAG y descripción general de Knowledge Bases

Fuentes de datos y estrategias de chunking

Uso de APIs e integración con Guardrails

Precios de Knowledge Bases

Resumen

Servicios relacionados

Artículos relacionados

Más sobre este tema

Artículos y servicios similares