Amazon OpenSearch Service
Motor de búsqueda y análisis gestionado compatible con Elasticsearch que soporta búsqueda de texto completo, análisis de logs y dashboards en tiempo real entre otros casos de uso
Descripción general
Amazon OpenSearch Service es un servicio de búsqueda y análisis gestionado compatible con Elasticsearch de código abierto. Proporciona capacidades de búsqueda de texto completo, análisis de logs, monitoreo en tiempo real y análisis de datos. Soporta OpenSearch Dashboards (compatible con Kibana) para visualización de datos, y ofrece opciones de clúster gestionado y serverless según los requisitos de la carga de trabajo.
El diseño de índices determina el rendimiento de consultas
En OpenSearch, el diseño de índices impacta directamente en el rendimiento de las consultas. La estrategia de sharding (número de shards primarios y réplicas) debe equilibrar la distribución de datos con la sobrecarga de gestión. Para datos basados en tiempo como logs, los índices rodantes (un índice por día/semana) combinados con políticas de gestión de estado de índices (ISM) automatizan la transición entre capas caliente, tibia y fría. El diseño de mappings (definiciones de campos) debe especificar tipos de datos apropiados y configurar analizadores para campos de texto según el idioma. Evitar mappings dinámicos en producción previene la explosión de campos y el consumo excesivo de memoria. El dimensionamiento de nodos debe considerar el volumen de datos, la tasa de ingesta y la complejidad de consultas, con la regla general de mantener el uso de almacenamiento por nodo por debajo del 80%.
UltraWarm y Cold - estrategia de capas para optimización de costos
OpenSearch Service ofrece tres capas de almacenamiento: Hot (instancias estándar con SSD), UltraWarm (almacenamiento respaldado por S3 con caché local) y Cold (almacenamiento S3 puro). Los datos recientes que requieren escritura y consultas rápidas residen en nodos Hot. Los datos más antiguos que se consultan con menos frecuencia migran a UltraWarm, que ofrece hasta un 90% de reducción de costos manteniendo tiempos de consulta razonables. Los datos Cold son los más económicos pero requieren re-adjuntar a UltraWarm antes de consultar. Las políticas ISM automatizan las transiciones entre capas basándose en la antigüedad del índice, eliminando la intervención manual. Esta estrategia de capas permite retener meses o años de datos de logs a un costo manejable mientras se mantiene acceso rápido a los datos recientes.
Criterios de selección entre clúster gestionado y Serverless
OpenSearch Service ofrece dos modelos de despliegue: clústeres gestionados y OpenSearch Serverless. Los clústeres gestionados proporcionan control total sobre la configuración (tipos de instancia, conteo de nodos, versiones de plugins) y son adecuados para cargas de trabajo predecibles donde se puede optimizar el dimensionamiento. OpenSearch Serverless elimina la gestión de infraestructura, escalando automáticamente la capacidad de computación y almacenamiento según la demanda. Serverless es ideal para cargas de trabajo con patrones de tráfico impredecibles o equipos que prefieren no gestionar clústeres. Sin embargo, Serverless tiene limitaciones en personalización de plugins y puede resultar más costoso para cargas de trabajo estables y predecibles. La elección depende de los requisitos de control operativo, patrones de tráfico y preferencias de gestión del equipo.