Computación edge y 5G - Ultra baja latencia con AWS Wavelength y Local Zones

Explicamos la computación de ultra baja latencia con AWS Wavelength y Local Zones. Presentamos el procesamiento en el edge de redes 5G, la colocación cercana en áreas urbanas, casos de uso y la diferenciación con regiones normales.

約 5 分で読めます最終更新: 2026-02-26

Demanda de computación de ultra baja latencia

Las regiones AWS normales tienen una latencia de decenas a cientos de milisegundos desde el usuario final, pero algunas aplicaciones no pueden tolerar esta latencia. El game streaming (cloud gaming) necesita menos de 20 milisegundos de latencia para un juego cómodo. En aplicaciones AR/VR, la latencia causa mareos. En la inferencia de vehículos autónomos, unos pocos milisegundos de latencia impactan directamente en la seguridad. AWS proporciona 2 opciones de computación edge con Wavelength y Local Zones para abordar estos requisitos de ultra baja latencia. Wavelength coloca cómputo AWS dentro de la red del operador de telecomunicaciones 5G, y la comunicación desde dispositivos 5G llega directamente a AWS sin pasar por Internet. Local Zones coloca infraestructura AWS en áreas metropolitanas, ejecutando el procesamiento cerca de los usuarios finales de esa ciudad.

Mecanismo de Wavelength

Las Wavelength Zones son infraestructura AWS instalada dentro de la red 5G del operador de telecomunicaciones. El tráfico desde dispositivos 5G se procesa dentro de la red del operador, sin necesidad de saltos a Internet, logrando latencia de milisegundos de un dígito (single-digit milliseconds). En Japón, en asociación con KDDI, se han instalado Wavelength Zones en Tokio y Osaka. En las Wavelength Zones se pueden usar instancias EC2, volúmenes EBS y subredes VPC. Se crea un carrier gateway en la VPC de la región padre (ejemplo: ap-northeast-1) y se añade una subred de la Wavelength Zone para desplegar. Desde las instancias en la Wavelength Zone se puede acceder a S3, DynamoDB, RDS y otros servicios de la región, construyendo arquitecturas que combinan procesamiento en el edge con almacenamiento de datos en la región.

Local Zones y diferenciación

Las Local Zones son infraestructura AWS instalada en áreas metropolitanas (más de 30 ciudades como Los Ángeles, Nueva York, Chicago, Dallas) que proporcionan latencia inferior a 10 milisegundos a los usuarios finales de esa ciudad. Mientras Wavelength se especializa en dispositivos 5G, Local Zones proporciona baja latencia a todos los usuarios de esa ciudad independientemente de si la conexión es cableada o inalámbrica. Están disponibles más servicios que en Wavelength Zones, incluyendo EC2, EBS, ECS, EKS, RDS y ElastiCache. Para la diferenciación: si se necesita ultra baja latencia (milisegundos de un dígito) desde dispositivos 5G, use Wavelength; si se necesita baja latencia (menos de 10 milisegundos) para usuarios de una ciudad específica, use Local Zones; de lo contrario, use la región normal. En Japón, actualmente no se ofrecen Local Zones, pero las Wavelength Zones (KDDI) están disponibles en Tokio y Osaka. Si desea aprender sistemáticamente sobre diseño de baja latencia, también puede consultar libros relacionados (Amazon).

Precios de Wavelength y Local Zones

Los precios de instancias EC2 en Wavelength Zones son equivalentes a los de la región normal, pero los tipos de instancia disponibles son limitados. La transferencia de datos a través del carrier gateway cuesta aproximadamente 0.05 dólares por GB. Los precios de EC2 en Local Zones tienden a ser aproximadamente 10-20% más altos que en la región. En ambos casos, los servicios disponibles son más limitados que en la región, por lo que se optimizan costos colocando solo los componentes con requisitos estrictos de latencia en Wavelength/Local Zones y procesando el resto en la región.

Resumen - Directrices de uso de computación edge

AWS Wavelength y Local Zones son opciones de computación edge para aplicaciones que necesitan ultra baja latencia. Wavelength logra procesamiento de milisegundos de un dígito dentro de la red 5G, y Local Zones logra procesamiento de menos de 10 milisegundos en áreas metropolitanas. Considérelos para casos de uso donde la latencia impacta directamente en la experiencia del usuario o el valor del negocio, como game streaming, AR/VR, análisis de video en tiempo real y trading financiero. Cuando los requisitos de latencia se pueden cumplir con la región normal, se recomienda usar la región desde la perspectiva de costos y servicios disponibles.

Por qué Auto Scaling escala rápido hacia afuera y es cauteloso al reducir - Intención de diseño de la lógica de decisión asimétricaExplica la razón del diseño asimétrico de EC2 Auto Scaling que ejecuta el scale-out inmediatamente mientras establece un período de enfriamiento para el scale-in, el mecanismo de prevención de flapping y la lógica interna del Target Tracking Scaling.Infraestructura adaptable a la demanda con AWS Auto Scaling - Diseño y optimización de políticas de escaladoPresenta cómo utilizar los 3 tipos de políticas (Target Tracking, Predictive y Scheduled) y lograr la optimización de costos con instancias Spot mediante Mixed Instances Policy.Diseño de dominios de fallo en AWS - El mecanismo de disponibilidad protegido por la estructura de 3 capas AZ, región y particiónExplicamos por qué la infraestructura de AWS está diseñada en 3 capas: AZ (aislamiento de fallos), región (separación geográfica) y partición (separación política), y hasta dónde se propagan los fallos en cada capa con ejemplos concretos.Principios de sistemas distribuidos aprendidos de las interrupciones de AWS - Arquitecturas transformadas por grandes incidentesUsando como material los informes de incidentes publicados por AWS, como la interrupción de S3 (2017), la interrupción de Kinesis (2020) y la particularidad de us-east-1, explicamos principios de diseño como Shuffle Sharding, Static Stability y Cell-based Architecture.Por qué AWS construye regiones allí - Los criterios desconocidos de selección de ubicación de centros de datosExplicamos los criterios de decisión que AWS considera al determinar la ubicación de regiones, como suministro eléctrico, riesgo geopolítico, legislación de soberanía de datos, conectividad de red y riesgo de desastres naturales, con ejemplos concretos de regiones.Por qué los Availability Zone ID de AWS difieren por cuenta - La intención de diseño detrás del mapeo de AZExplicamos cómo us-east-1a apunta a diferentes AZ físicas por cuenta, por qué se introdujeron los AZ ID (use1-az1), la intención de diseño de distribución uniforme de capacidad y las consideraciones para la especificación de AZ entre cuentas.Infraestructura de computación por lotes - Procesamiento paralelo a gran escala con AWS BatchExplicamos cómo construir procesamiento por lotes a gran escala con AWS Batch. Cubrimos el diseño de colas de trabajos, auto-escalado de entornos de cómputo, optimización de costos con instancias Spot y la construcción de infraestructura de lotes ideal para computación científica y procesamiento de datos a gran escala.Streaming en vivo con calidad broadcast - Construcción de plataforma de distribución a gran escala con AWS Elemental MediaLive y MediaPackageExplicamos cómo construir una plataforma de streaming en vivo con calidad broadcast usando AWS Elemental MediaLive y MediaPackage. Cubrimos transcodificación en tiempo real, DRM, inserción de anuncios y distribución multi-CDN.

Demanda de computación de ultra baja latencia

Mecanismo de Wavelength

Local Zones y diferenciación

Precios de Wavelength y Local Zones

Resumen - Directrices de uso de computación edge

Servicios relacionados

Artículos relacionados

Más sobre este tema

Artículos y servicios similares