Amazon OpenSearch Service Popular2015年〜
Servicio gestionado de búsqueda y análisis para análisis de logs y búsqueda de texto completo
Qué hace
Amazon OpenSearch Service es un servicio completamente gestionado para análisis de logs, búsqueda de texto completo y monitoreo de aplicaciones en tiempo real. Basado en el proyecto de código abierto OpenSearch (un fork de Elasticsearch), indexa grandes volúmenes de datos para búsqueda y agregación rápidas. Incluye OpenSearch Dashboards para visualización de forma estándar, permitiéndole concentrarse en el análisis de datos mientras AWS gestiona la infraestructura.
Casos de uso
Se utiliza para agregar, buscar y visualizar logs de aplicaciones e infraestructura, motores de búsqueda de texto completo para sitios de comercio electrónico y portales, detección y análisis de eventos de seguridad (SIEM), análisis de datos de clickstream en tiempo real y almacenamiento y análisis de datos de telemetría de dispositivos IoT.
Analogía cotidiana
Es como un bibliotecario. De una vasta colección (datos), encuentra instantáneamente libros relevantes con solo escuchar una palabra clave. Además de buscar, también compila tendencias en gráficos y le notifica automáticamente cuando llegan nuevos libros, sirviendo como herramienta de búsqueda, análisis y monitoreo todo en uno.
¿Qué es OpenSearch Service?
Amazon OpenSearch Service es un servicio gestionado de búsqueda y análisis proporcionado por AWS. Originalmente ofrecido como Amazon Elasticsearch Service, fue renombrado en 2021 con el lanzamiento del proyecto de código abierto OpenSearch. Usando una estructura de datos llamada índice invertido, puede realizar búsquedas de texto completo en miles de millones de documentos en milisegundos. Los datos se ingestan, buscan y agregan a través de API REST, y se visualizan con OpenSearch Dashboards.
Características principales
OpenSearch Service automatiza la construcción y operación de clústeres. AWS gestiona el inicio de nodos, parches de software, copias de seguridad y monitoreo, para que los usuarios puedan concentrarse en diseñar consultas de búsqueda y construir dashboards. Incluye funciones de seguridad de nivel empresarial como despliegue multi-AZ para alta disponibilidad, cifrado en reposo y en tránsito, y aislamiento de red mediante ubicación en VPC. Con OpenSearch Serverless, ni siquiera necesita gestionar clústeres.
Análisis de logs y visualización
El caso de uso más común de OpenSearch Service es el análisis de logs. Ingeste datos de logs desde CloudWatch Logs, Kinesis Data Firehose, Logstash y más, indexe y busque y agregue. OpenSearch Dashboards permite crear diversas visualizaciones incluyendo gráficos de líneas, barras, mapas de calor y mapas, construyendo dashboards en tiempo real. Con alertas configuradas, puede enviar notificaciones a SNS o Slack cuando se detectan logs que coinciden con condiciones específicas. Para las últimas tendencias y técnicas prácticas en análisis de logs y visualización, los libros especializados en Amazon son un excelente recurso de aprendizaje.
Precios
Los precios de OpenSearch Service se basan en el tipo de instancia, número de instancias y capacidad de almacenamiento. Hay dos opciones de precios disponibles: bajo demanda e instancias reservadas, con instancias reservadas ofreciendo hasta un 50% de descuento. Al usar OpenSearch Serverless, se cobra por unidades de cómputo (OCU) utilizadas para indexación y procesamiento de consultas de búsqueda, más almacenamiento. Para pruebas a pequeña escala, puede comenzar con una sola instancia t3.small.search.
Primeros pasos
Para comenzar con OpenSearch Service, abra el panel de OpenSearch Service en la Consola de Administración de AWS y cree un dominio (clúster). Seleccione el tipo de instancia, número de nodos y tamaño de almacenamiento, configure la política de acceso y el clúster se lanza en minutos. Una vez en ejecución, ingeste documentos a través de API REST y ejecute consultas de búsqueda. Acceda a la URL de OpenSearch Dashboards para crear visualizaciones de datos y dashboards en su navegador.
Aspectos a tener en cuenta
- Index shard count and replica count design significantly impacts performance, so proper design based on data volume and search patterns is essential
- When storage capacity reaches its limit, indexes become read-only. Configure Index State Management (ISM) for automatic deletion or archiving of old data