Amazon EC2

Servicio de servidores virtuales en la nube de AWS que permite seleccionar la configuración óptima entre cientos de tipos de instancia y lanzar servidores en minutos

Descripción general

Amazon Elastic Compute Cloud (EC2) es el servicio central de computación en la nube de AWS. Elimina la necesidad de comprar e instalar servidores físicos, permitiendo lanzar servidores virtuales (instancias) con la capacidad de cómputo necesaria en minutos. Ofrece cientos de tipos de instancia optimizados para diferentes cargas de trabajo, desde propósito general hasta optimizados para cómputo, memoria, almacenamiento y computación acelerada con GPU.

Nitro System y cómo elegir familias de instancias

Las instancias EC2 de generación actual se ejecutan sobre Nitro System, una plataforma de virtualización desarrollada por AWS que descarga las funciones de red, almacenamiento y seguridad a hardware dedicado, entregando casi todo el rendimiento del hardware subyacente a la instancia. Las familias de instancias se seleccionan según la carga de trabajo: M (propósito general) para aplicaciones web y bases de datos medianas, C (optimizada para cómputo) para procesamiento por lotes y codificación de video, R (optimizada para memoria) para bases de datos en memoria y cachés, y P/G (computación acelerada) para machine learning y renderizado gráfico. El sufijo numérico indica la generación (mayor es más nuevo y mejor relación rendimiento/precio), y los sufijos de letra indican variantes: g para procesadores Graviton (ARM), a para procesadores AMD, y d para almacenamiento NVMe local incluido.

Diseño de precios: bajo demanda, reservadas y Spot

EC2 ofrece tres modelos principales de precios. Las instancias bajo demanda cobran por segundo sin compromiso, ideales para cargas de trabajo impredecibles o de corta duración. Las instancias reservadas (RI) y Savings Plans ofrecen descuentos de hasta el 72% a cambio de un compromiso de 1 o 3 años, adecuados para cargas de trabajo estables y predecibles. Las instancias Spot aprovechan la capacidad no utilizada de AWS con descuentos de hasta el 90%, pero pueden ser interrumpidas con 2 minutos de aviso. La estrategia óptima combina los tres modelos: reservadas para la carga base, bajo demanda para picos predecibles y Spot para cargas de trabajo tolerantes a interrupciones como procesamiento por lotes, CI/CD y entrenamiento de ML. Savings Plans son más flexibles que las RI tradicionales al aplicarse automáticamente a cualquier familia de instancias, región y sistema operativo.

Auto Scaling y estrategias de ubicación

EC2 Auto Scaling ajusta automáticamente el número de instancias según la demanda, manteniendo la disponibilidad y optimizando costos. Las políticas de escalado pueden basarse en métricas de CloudWatch (utilización de CPU, solicitudes por segundo), programaciones predefinidas o escalado predictivo basado en machine learning. Los grupos de Auto Scaling distribuyen instancias entre múltiples zonas de disponibilidad para alta disponibilidad. Las estrategias de ubicación (Placement Groups) controlan cómo se colocan las instancias en el hardware subyacente: Cluster agrupa instancias en la misma zona para baja latencia de red, Spread distribuye instancias en hardware distinto para máxima resiliencia, y Partition divide en grupos lógicos para cargas de trabajo distribuidas como Hadoop o Cassandra. La combinación de Auto Scaling con Launch Templates permite definir configuraciones de instancia versionadas y reutilizables.

共有するXB!