Por qué el modelo de precios de AWS es complejo - La economía y la teoría de juegos detrás del pago por uso

Desciframos la estructura de precios de tres niveles (bajo demanda, instancias reservadas y Spot Instances) desde la perspectiva de la gestión de rendimiento de la industria aérea y la economía de predicción de demanda, explicando las razones racionales de la complejidad de precios.

La complejidad de precios tiene una razón

La insatisfacción con el sistema de precios de AWS es ampliamente compartida. Solo para EC2 existen múltiples opciones de compra: bajo demanda, instancias reservadas, Savings Plans, Spot Instances y Dedicated Host, cada una con precios que varían según la combinación de familia de instancias, región, sistema operativo y tenencia. Las tarifas de transferencia de datos se cobran por separado para dentro de la región, entre regiones y hacia Internet, e incluso dentro de la misma región se generan cargos al cruzar AZs. Esta complejidad no es un fallo de diseño, sino una estructura racional derivada de las características económicas del bien llamado computación en la nube. Al comprender su mecanismo, se hace posible una optimización de costos esencial, no basada en técnicas superficiales.

La economía del pago por uso - Por qué no se usa tarifa fija

Podría pensarse que sería más claro tener una tarifa mensual fija como los planes de telefonía móvil. Sin embargo, los patrones de uso de la computación en la nube varían extremadamente entre clientes. Un cliente puede usar EC2 solo unas horas al mes, mientras otro lo ejecuta 24 horas al día, 365 días al año. Con una tarifa fija, los usuarios ligeros subsidiarían los costos de los usuarios intensivos. Esto es lo que en economía se llama subsidio cruzado (cross-subsidy), y es injusto para los usuarios ligeros. El pago por uso es la consecuencia de la equidad donde cada cliente paga según su volumen de uso. Además, el pago por uso proporciona a los clientes un incentivo para usar los recursos eficientemente. Al pagar solo por lo que se usa, el costo de dejar recursos innecesarios se hace visible y surge la motivación para optimizar. Con tarifa fija, tiende a haber desperdicio de recursos con la mentalidad de "de todos modos es tarifa plana", lo que para el proveedor de nube también significa un aumento en los costos de infraestructura.

Tres opciones de compra - Similitud con la industria aérea

Las tres principales opciones de compra de AWS tienen una estructura sorprendentemente similar a la gestión de rendimiento (yield management) de la industria aérea. Las instancias bajo demanda equivalen a la compra de billetes de avión el mismo día. Son las más caras, pero están disponibles en cualquier momento y sin restricciones de cancelación. Se está pagando una prima por la flexibilidad. Las instancias reservadas y Savings Plans equivalen a la compra anticipada con descuento de billetes de avión. Al comprometerse a un uso de 1 o 3 años, se puede recibir hasta un 72% de descuento. Las aerolíneas descuentan las reservas anticipadas porque conocer la demanda futura de antemano tiene valor. De manera similar, para AWS las instancias reservadas son un medio para predecir el uso futuro de los clientes. Si mejora la precisión de la predicción de demanda, se puede optimizar la planificación de capacidad del centro de datos, reduciendo el riesgo de sobreinversión o falta de capacidad. Cuanto más largo es el período de compromiso, mayor es la tasa de descuento, porque la predicción de demanda a largo plazo tiene más valor. Esta es la misma estructura que la prima de riesgo en finanzas. Las Spot Instances equivalen a las ventas de último minuto de billetes de avión. En los centros de datos de AWS siempre existe capacidad excedente no utilizada por instancias reservadas o bajo demanda. Es más rentable ofrecer este excedente con un gran descuento que dejarlo inactivo. Las Spot Instances tienen hasta un 90% de descuento, pero pueden interrumpirse con 2 minutos de aviso cuando AWS necesita la capacidad.

La estructura de las tarifas de transferencia de datos - Por qué la entrada es gratis y la salida es de pago

Las tarifas de transferencia de datos de AWS tienen una asimetría clara. La transferencia de datos hacia AWS (ingress) es gratuita, pero la transferencia desde AWS (egress) es de pago. Esta estructura es económicamente racional. Al hacer gratuito el ingress, se reduce la barrera para que los clientes migren datos a AWS. Una vez que los datos se acumulan en AWS, aumenta el uso de computación y almacenamiento que utiliza esos datos, expandiendo los ingresos de AWS. Al hacer de pago el egress, se genera un costo por sacar datos fuera de AWS, lo que resulta en que los datos tienden a permanecer dentro del ecosistema AWS. Esta es una forma de costo de cambio (switching cost) y tiene un efecto de lock-in. Visto críticamente, las tarifas de egress también pueden interpretarse como un medio para limitar las opciones del cliente. De hecho, este punto se debate en toda la industria, y algunos proveedores de nube están reduciendo o eliminando las tarifas de egress como diferenciación competitiva. AWS también redujo parte de las tarifas de transferencia de datos hacia Internet en 2024.

El significado estratégico de la capa gratuita

La capa gratuita de AWS no es caridad, sino una estrategia para optimizar el costo de adquisición de clientes (CAC). La capa gratuita de 12 meses es un período suficiente para que los nuevos clientes prueben los servicios de AWS, aprendan y construyan dependencias. Si la aplicación del cliente comienza a funcionar en AWS durante este período, la probabilidad de uso continuado después de que expire la capa gratuita aumenta. Las capas gratuitas permanentes como 1 millón de solicitudes mensuales de Lambda y 25 GB de almacenamiento de DynamoDB funcionan como un embudo que atrae cargas de trabajo pequeñas a AWS y las transiciona a uso de pago a medida que crecen. Esta es una variación del modelo freemium, con la misma lógica que las empresas SaaS que ofrecen planes gratuitos.

Implicaciones para la optimización práctica de costos

Tras comprender la economía de la estructura de precios, organizamos las directrices para la optimización práctica de costos. Primero, clasificar las cargas de trabajo en tres categorías. Para cargas de trabajo siempre activas y predecibles, aplicar Savings Plans o instancias reservadas. El período de compromiso se elige considerando la posibilidad de cambios en el stack tecnológico. Si la posibilidad de cambio es alta, 1 año es apropiado; si es estable, 3 años. Para procesamiento por lotes interrumpible y entornos de prueba, utilizar Spot Instances. Incorporar funcionalidad de checkpoints y reanudación de trabajos en el diseño para tolerar las interrupciones de Spot. Para cargas de trabajo de ráfaga impredecibles, usar bajo demanda. Bajo demanda no es "caro" sino "el precio justo por la flexibilidad". Optimizar los costos de transferencia de datos en la fase de diseño. La comunicación dentro de la misma AZ es gratuita, por lo que los componentes que se comunican intensamente deben colocarse en la misma AZ. El egress a través de CloudFront puede ser más barato que la transferencia directa a Internet, por lo que también se debe considerar el uso de CDN. Para aprender sistemáticamente sobre optimización de costos de AWS, los libros relacionados (Amazon) también son una buena referencia.

Resumen

La complejidad del modelo de precios de AWS es una estructura racional derivada de las características económicas del bien llamado computación en la nube. El pago por uso logra una distribución equitativa del uso, las tres opciones de compra son el mismo mecanismo de predicción de demanda que la gestión de rendimiento de la industria aérea. La asimetría en las tarifas de transferencia de datos tiene un efecto de lock-in, y la capa gratuita funciona como un embudo de adquisición de clientes. Al comprender estructuralmente el mecanismo de precios, se hace posible una optimización de costos esencial basada en la racionalidad económica, no en técnicas superficiales.