Computación edge y 5G - Ultra baja latencia con AWS Wavelength y Local Zones
Explicamos la computación de ultra baja latencia con AWS Wavelength y Local Zones. Presentamos el procesamiento en el edge de redes 5G, la colocación cercana en áreas urbanas, casos de uso y la diferenciación con regiones normales.
Demanda de computación de ultra baja latencia
Las regiones AWS normales tienen una latencia de decenas a cientos de milisegundos desde el usuario final, pero algunas aplicaciones no pueden tolerar esta latencia. El game streaming (cloud gaming) necesita menos de 20 milisegundos de latencia para un juego cómodo. En aplicaciones AR/VR, la latencia causa mareos. En la inferencia de vehículos autónomos, unos pocos milisegundos de latencia impactan directamente en la seguridad. AWS proporciona 2 opciones de computación edge con Wavelength y Local Zones para abordar estos requisitos de ultra baja latencia. Wavelength coloca cómputo AWS dentro de la red del operador de telecomunicaciones 5G, y la comunicación desde dispositivos 5G llega directamente a AWS sin pasar por Internet. Local Zones coloca infraestructura AWS en áreas metropolitanas, ejecutando el procesamiento cerca de los usuarios finales de esa ciudad.
Mecanismo de Wavelength
Las Wavelength Zones son infraestructura AWS instalada dentro de la red 5G del operador de telecomunicaciones. El tráfico desde dispositivos 5G se procesa dentro de la red del operador, sin necesidad de saltos a Internet, logrando latencia de milisegundos de un dígito (single-digit milliseconds). En Japón, en asociación con KDDI, se han instalado Wavelength Zones en Tokio y Osaka. En las Wavelength Zones se pueden usar instancias EC2, volúmenes EBS y subredes VPC. Se crea un carrier gateway en la VPC de la región padre (ejemplo: ap-northeast-1) y se añade una subred de la Wavelength Zone para desplegar. Desde las instancias en la Wavelength Zone se puede acceder a S3, DynamoDB, RDS y otros servicios de la región, construyendo arquitecturas que combinan procesamiento en el edge con almacenamiento de datos en la región.
Local Zones y diferenciación
Las Local Zones son infraestructura AWS instalada en áreas metropolitanas (más de 30 ciudades como Los Ángeles, Nueva York, Chicago, Dallas) que proporcionan latencia inferior a 10 milisegundos a los usuarios finales de esa ciudad. Mientras Wavelength se especializa en dispositivos 5G, Local Zones proporciona baja latencia a todos los usuarios de esa ciudad independientemente de si la conexión es cableada o inalámbrica. Están disponibles más servicios que en Wavelength Zones, incluyendo EC2, EBS, ECS, EKS, RDS y ElastiCache. Para la diferenciación: si se necesita ultra baja latencia (milisegundos de un dígito) desde dispositivos 5G, use Wavelength; si se necesita baja latencia (menos de 10 milisegundos) para usuarios de una ciudad específica, use Local Zones; de lo contrario, use la región normal. En Japón, actualmente no se ofrecen Local Zones, pero las Wavelength Zones (KDDI) están disponibles en Tokio y Osaka. Si desea aprender sistemáticamente sobre diseño de baja latencia, también puede consultar libros relacionados (Amazon).
Precios de Wavelength y Local Zones
Los precios de instancias EC2 en Wavelength Zones son equivalentes a los de la región normal, pero los tipos de instancia disponibles son limitados. La transferencia de datos a través del carrier gateway cuesta aproximadamente 0.05 dólares por GB. Los precios de EC2 en Local Zones tienden a ser aproximadamente 10-20% más altos que en la región. En ambos casos, los servicios disponibles son más limitados que en la región, por lo que se optimizan costos colocando solo los componentes con requisitos estrictos de latencia en Wavelength/Local Zones y procesando el resto en la región.
Resumen - Directrices de uso de computación edge
AWS Wavelength y Local Zones son opciones de computación edge para aplicaciones que necesitan ultra baja latencia. Wavelength logra procesamiento de milisegundos de un dígito dentro de la red 5G, y Local Zones logra procesamiento de menos de 10 milisegundos en áreas metropolitanas. Considérelos para casos de uso donde la latencia impacta directamente en la experiencia del usuario o el valor del negocio, como game streaming, AR/VR, análisis de video en tiempo real y trading financiero. Cuando los requisitos de latencia se pueden cumplir con la región normal, se recomienda usar la región desde la perspectiva de costos y servicios disponibles.