Guía práctica de Amazon OpenSearch Serverless - Diseño de OCU y estrategias de optimización por tipo de colección

Explicación práctica de Amazon OpenSearch Serverless. Se presenta el diseño de OCU, los tipos de colección, las estrategias de optimización y los patrones de integración.

約 4 分で読めます最終更新: 2026-04-24

Arquitectura de OpenSearch Serverless

OpenSearch Serverless separa el cómputo y el almacenamiento, escalando cada uno de forma independiente. Las OCU (OpenSearch Compute Units) son las unidades de capacidad de cómputo, divididas en OCU de indexación (escritura) y OCU de búsqueda (lectura). Cada OCU proporciona 6 GB de RAM y la capacidad de cómputo correspondiente. El mínimo es 2 OCU de indexación y 2 OCU de búsqueda (total 4 OCU), escalando automáticamente según la carga.

Tipos de colección y selección

OpenSearch Serverless ofrece tres tipos de colección. Las colecciones de búsqueda están optimizadas para búsqueda de texto completo con baja latencia, adecuadas para búsqueda de productos en e-commerce y búsqueda de contenido. Las colecciones de series temporales están optimizadas para análisis de logs y datos de métricas, con alto throughput de escritura y consultas eficientes por rango temporal. Las colecciones de búsqueda vectorial están optimizadas para búsqueda de similitud vectorial, adecuadas para búsqueda semántica y RAG. El tipo de colección no puede cambiarse después de la creación, por lo que es importante seleccionar el tipo apropiado según el caso de uso.

Diseño de OCU y optimización de costos

El diseño de OCU impacta directamente en el rendimiento y los costos. El mínimo de 4 OCU cuesta aproximadamente 700 dólares mensuales (0.24 dólares/hora por OCU x 4 OCU x 730 horas). Para optimizar costos, es importante dimensionar apropiadamente las OCU máximas según los patrones de carga. Para cargas de trabajo con picos predecibles, configurar las OCU máximas para cubrir los picos permite el escalado automático. Para cargas de trabajo constantes, mantener las OCU mínimas cerca de la carga promedio reduce los costos de escalado innecesario. Para aprender sobre búsqueda y analítica de datos, libros técnicos (Amazon) son útiles como referencia.

Seguridad y control de acceso

OpenSearch Serverless utiliza políticas de acceso a datos para controlar el acceso a nivel de colección e índice. Las políticas de cifrado definen las claves KMS utilizadas para cifrar los datos. Las políticas de red controlan si la colección es accesible desde Internet o solo desde VPC Endpoints. La integración con IAM permite un control de acceso granular basado en roles IAM y usuarios de SAML.

Patrones de integración

OpenSearch Serverless se integra con múltiples servicios AWS. OpenSearch Ingestion permite construir pipelines de ingestión de datos sin código, transformando y enrutando datos desde fuentes como S3, Kinesis y CloudWatch Logs. La integración con Amazon Bedrock Knowledge Bases permite utilizar colecciones de búsqueda vectorial como almacén de vectores para RAG. Lambda puede utilizarse para indexación en tiempo real de eventos de DynamoDB Streams o Kinesis.

Resumen

Amazon OpenSearch Serverless elimina la gestión de clústeres proporcionando capacidades de búsqueda y análisis con escalado automático. La selección del tipo de colección apropiado (búsqueda, series temporales, búsqueda vectorial) y el diseño adecuado de OCU son clave para optimizar rendimiento y costos. La integración con OpenSearch Ingestion y Bedrock Knowledge Bases amplía los casos de uso desde análisis de logs hasta búsqueda semántica con IA.

Uso práctico de Amazon Quick - Casos de uso por departamento y patrones de diseño para automatización de flujos de trabajoPresentamos escenarios de uso concretos para departamentos de ventas, TI y finanzas, así como patrones de diseño para notificaciones, aprobaciones y flujos de trabajo de múltiples etapas con Quick Flows.Visualización de dashboards BI - Plataforma de decisiones basada en datos con Amazon QuickSightExplicamos la construcción de dashboards BI interactivos con Amazon QuickSight y una plataforma de análisis de datos serverless con integración Athena. Presentamos la visualización de alta velocidad con el motor SPICE y métodos prácticos para compartir insights en toda la organización.Construcción de redes blockchain - Aprovechamiento de libros mayores distribuidos con Amazon Managed Blockchain y QLDBExplicamos la construcción de redes blockchain con Amazon Managed Blockchain y el uso de Amazon QLDB como base de datos de libro mayor verificable. Presentamos casos de uso prácticos como gestión de cadena de suministro y transparencia en transacciones financieras.Colaboración de datos con preservación de privacidad con AWS Clean RoomsEjecute análisis conjuntos entre múltiples empresas sin compartir ni copiar datos. Aprenda sobre reglas de agregación para prevenir la identificación individual y Cryptographic Computing para análisis cifrado.Unificación de identidad de clientes - Resolución de entidades de datos de clientes dispersos con AWS Entity ResolutionResolución de entidades (name matching) de datos de clientes con AWS Entity Resolution. Matching basado en ML, matching basado en reglas, protección de privacidad e integración con Clean Rooms.Aprovechamiento de datos de terceros con AWS Data Exchange - Adquisición de datos y gestión de suscripcionesAdquiera productos de datos de terceros a través de Marketplace y construya pipelines de entrega automática a S3. También se presentan técnicas de productización y monetización de datos propios.Construcción de data lake con Amazon S3 y Lake Formation - Patrones de diseño y gobernanzaPatrones de diseño de data lake con S3 como base de almacenamiento y control de acceso granular con Lake Formation. También se explican pipelines ETL y optimización de costos.Gobernanza de data lake - Control de acceso centralizado con AWS Lake FormationConstrucción, control de acceso y gobernanza de data lake con AWS Lake Formation. Gestión granular de permisos a nivel de columna y fila para data lakes basados en S3, e integración con Glue y Athena.

Arquitectura de OpenSearch Serverless

Tipos de colección y selección

Diseño de OCU y optimización de costos

Seguridad y control de acceso

Patrones de integración

Resumen

Artículos relacionados

Más sobre este tema

Artículos y servicios similares