Amazon Neptune のアイコン

Amazon Neptune Especializado2017年〜

Servicio de base de datos de grafos gestionado para procesar conjuntos de datos altamente conectados

Qué hace

Amazon Neptune es una base de datos de grafos completamente gestionada que admite tanto grafos de propiedades (Apache TinkerPop Gremlin) como RDF (SPARQL). Modela las relaciones entre datos mediante nodos (vértices) y aristas, ejecutando consultas de relaciones complejas a alta velocidad. Los datos se replican automáticamente en hasta tres zonas de disponibilidad para alta disponibilidad.

Casos de uso

Se utiliza para analizar relaciones de amistad y seguimiento en redes sociales, detectar patrones de transacciones para la detección de fraudes, construir grafos de conocimiento, motores de recomendación y gestión de topologías de red.

Analogía cotidiana

Es como un diagrama de relaciones. Mientras que una base de datos relacional gestiona datos en formato de tabla, Neptune almacena las relaciones como datos: 'La persona A es amiga de la persona B, y la persona B es colega de la persona C'. Puede recorrer rápidamente relaciones de múltiples saltos como 'amigos de amigos'.

¿Qué es Neptune?

Amazon Neptune es una base de datos de grafos que almacena y consulta eficientemente las relaciones entre datos. Consultas como 'productos comprados por amigos de amigos', que requieren múltiples operaciones JOIN en una base de datos relacional, se ejecutan como recorridos rápidos de grafos en Neptune. Con Neptune Serverless, escala automáticamente según la carga de trabajo y reduce costos durante períodos de inactividad.

Gremlin y SPARQL

Neptune admite dos lenguajes de consulta. Gremlin es un lenguaje de recorrido para grafos de propiedades, donde se construyen grafos con propiedades arbitrarias en nodos y aristas. SPARQL es un lenguaje de consulta para RDF (Resource Description Framework), que expresa datos como tripletas sujeto-predicado-objeto. SPARQL es adecuado para construir grafos de conocimiento y ontologías, mientras que Gremlin es mejor para el modelado de datos de aplicaciones. Para profundizar en el conocimiento práctico de Gremlin y SPARQL, los libros relacionados en Amazon son útiles.

Primeros pasos

Cree un clúster en la consola de Neptune y seleccione una clase de instancia. Se despliega dentro de una VPC, por lo que se conecta desde EC2 o Lambda a través de la VPC. Puede probar consultas en la consola de Gremlin o Neptune Workbench (Jupyter Notebook). Elija Neptune Serverless para comenzar sin configurar capacidad previamente.

Aspectos a tener en cuenta

  • Deployed within a VPC, so it cannot be accessed directly from the public internet. A bastion host or VPN is required
  • Neptune Serverless can auto-scale based on workload, but latency may increase during cold starts
共有するXB!