AWS Graviton y la estrategia de silicio personalizado - Los chips de diseño propio que transforman la economía de la nube

Comparamos cómo los procesadores Graviton basados en Arm diseñados por AWS y los chips de silicio personalizado para IA como Inferentia y Trainium están cambiando la estructura de costos y el rendimiento de la nube frente a Azure y GCP.

Por qué los proveedores de nube diseñan sus propios chips

En la estructura de costos de la computación en la nube, el procesador del servidor es uno de los factores de costo más grandes. Tradicionalmente, los proveedores de nube compraban procesadores genéricos de Intel o AMD para instalarlos en sus servidores. Sin embargo, los procesadores genéricos están diseñados para manejar cualquier carga de trabajo, por lo que para cargas de trabajo específicas de la nube tienen funcionalidades excesivas y no son óptimos en eficiencia energética ni de costos. AWS eligió el enfoque fundamental de diseñar sus propios procesadores para este problema. Presentó el primer procesador Graviton en 2018, Graviton2 en 2019, Graviton3 en 2022 y Graviton4 en 2023, evolucionando rápidamente en cada generación.

La ventaja técnica de Graviton

La ventaja de los procesadores Graviton no es simplemente un precio más bajo, sino un diseño especializado para cargas de trabajo en la nube. Graviton4 tiene 96 núcleos, con un rendimiento de computación hasta un 30% superior y un ancho de banda de memoria un 75% mayor comparado con Graviton3. Al adoptar la arquitectura Arm, el consumo de energía por núcleo es menor que x86, permitiendo más núcleos con el mismo presupuesto de energía. Esta es una característica adecuada para cargas de trabajo en la nube que procesan muchas solicitudes paralelas, como servidores web, contenedores y microservicios. Graviton está optimizado para el entorno de nube de AWS, logrando una integración profunda con el Nitro System.

Comparación con las estrategias de silicio personalizado de Azure y GCP

Azure dependió durante mucho tiempo de procesadores genéricos de Intel y AMD, pero en 2023 anunció su procesador basado en Arm de diseño propio Cobalt 100. Con 128 núcleos, está diseñado para cargas de trabajo de propósito general. Sin embargo, Cobalt 100 es posterior a Graviton de AWS y tiene diferencias en trayectoria de mercado y acumulación de optimizaciones. Graviton ha pasado por 4 generaciones desde la primera en 2018, incorporando retroalimentación de cargas de trabajo en la nube en cada generación. Maia 100 de Azure es un chip personalizado para cargas de trabajo de IA, pero también tiene trayectoria de mercado limitada. GCP tiene los TPU (Tensor Processing Units) como silicio personalizado para IA, liderando en el entrenamiento de modelos de lenguaje grandes. Sin embargo, GCP no tiene silicio personalizado para computación de propósito general equivalente a Graviton.

Inferentia y Trainium - Silicio personalizado para la era de la IA

Con la rápida proliferación de la IA generativa, la demanda de computación para cargas de trabajo de IA ha aumentado explosivamente. Las GPUs de NVIDIA son el estándar de facto para cargas de trabajo de IA, pero el aumento de la demanda ha tensionado el suministro y elevado los precios. AWS ha desarrollado dos chips personalizados para este desafío: Inferentia para inferencia de IA y Trainium para entrenamiento de IA. Inferentia2 logra una reducción de costos de hasta el 50% comparado con instancias GPU equivalentes para cargas de trabajo de inferencia. Es adecuado para ejecutar modelos entrenados en producción, como inferencia de modelos de lenguaje grandes (LLM), reconocimiento de imágenes y procesamiento de lenguaje natural.

El impacto económico del silicio personalizado

El impacto económico de la estrategia de silicio personalizado no se limita a la diferencia de precio de los chips. Al usar chips de diseño propio, AWS puede eliminar las tarifas de licencia y márgenes a Intel o AMD, controlando directamente la estructura de costos de los chips. Este ahorro se devuelve a los usuarios en forma de reducciones en los precios de las instancias. Que las instancias basadas en Graviton sean aproximadamente un 20% más baratas que las basadas en x86 es un reflejo de esta ventaja estructural de costos. Además, la mejora en eficiencia energética reduce los costos operativos del centro de datos.

Facilidad de migración y madurez del ecosistema

Por muy alta que sea la ventaja del silicio personalizado, no tiene sentido si no se pueden migrar las cargas de trabajo existentes. La migración a Graviton es relativamente fácil para muchas cargas de trabajo. Las cargas de trabajo basadas en Linux a menudo funcionan simplemente recompilando a binarios compatibles con Arm, y las cargas de trabajo en contenedores pueden ejecutarse tanto en x86 como en Graviton usando imágenes multi-arquitectura. AWS ha enriquecido las herramientas y documentación para apoyar la migración a Graviton. El programa Graviton Ready confirma que los principales proveedores de software han completado la verificación de funcionamiento en Graviton. Las principales distribuciones de Linux, bases de datos, frameworks de aplicaciones y herramientas CI/CD ya soportan Graviton.

Resumen

La estrategia de silicio personalizado de AWS es un enfoque integral que cubre 3 áreas: computación de propósito general (Graviton), inferencia de IA (Inferentia) y entrenamiento de IA (Trainium). Graviton ha logrado hasta un 40% de mejora en relación costo-rendimiento comparado con procesadores x86 a través de 4 generaciones de evolución, y la madurez del ecosistema también ha aumentado. Cobalt 100 y Maia 100 de Azure son posteriores con menos trayectoria acumulada. Los TPU de GCP lideran en el área de IA pero no tienen silicio personalizado para computación de propósito general. Transformar fundamentalmente la estructura de costos de la nube es una ventaja estructural que solo es posible con la estrategia de silicio personalizado de AWS.