Monitoreo del rendimiento de Internet con Amazon CloudWatch Internet Monitor - Visualización de disponibilidad y latencia

Explicamos el monitoreo del rendimiento de aplicaciones a través de Internet con Internet Monitor, el análisis de disponibilidad por ISP y la detección de eventos de salud.

Descripción general de Internet Monitor

Internet Monitor es un servicio que utiliza datos de medición de Internet de más de 500 ciudades en todo el mundo, analiza el tráfico de distribuciones de CloudFront y VPC, y monitorea el rendimiento de las aplicaciones a través de Internet. Combina los datos de medición de Internet que AWS recopila globalmente con los datos de tráfico de la aplicación para visualizar la disponibilidad y la latencia por ISP y región. A diferencia del monitoreo sintético tradicional que mide la accesibilidad desde puntos de sondeo, Internet Monitor detecta problemas que ocurren en la ruta real del tráfico de usuarios, proporcionando un monitoreo más cercano a la experiencia real del usuario. Crear un monitor se completa en pocos clics en la consola de AWS: simplemente especifique una distribución de CloudFront o VPC para comenzar el monitoreo.

Eventos de salud y patrones de uso

Internet Monitor genera eventos de salud cuando una falla del lado de Internet está afectando a la aplicación. Proporciona información como la disminución de disponibilidad en un ISP específico o el aumento de latencia en una región particular. Los eventos de salud incluyen estimaciones del volumen de tráfico afectado y la cantidad de usuarios, permitiendo una evaluación cuantitativa del alcance del impacto. Puede recibir notificaciones a través de EventBridge y construir flujos de trabajo de respuesta automática que ejecuten el cambio de origen de CloudFront o el failover de Route 53. La visualización de la distribución geográfica del tráfico también puede utilizarse para la selección de ubicaciones de borde de CDN y la optimización de la ubicación de regiones. Los eventos de salud se clasifican en dos tipos - degradación de disponibilidad y aumento de latencia - cada uno con umbrales personalizables.

Uso para la optimización del tráfico

Utilizando los datos de Internet Monitor, es posible la optimización del tráfico combinada con el failover de origen de CloudFront y los health checks de Route 53. Cuando el rendimiento se degrada en un ISP o región específica, sirve como material de decisión para dirigir el tráfico a otra región mediante el enrutamiento geográfico de Route 53. Puede construir flujos de trabajo que reciban eventos de salud a través de EventBridge y cambien automáticamente el comportamiento de caché de CloudFront con Lambda o notifiquen al equipo de operaciones con SNS. Analice los datos de rendimiento históricos para identificar patrones de degradación de rendimiento constantes que ocurren en horarios o regiones específicas, y optimice la configuración de CDN y la ubicación de los orígenes. Habilitar la exportación de logs a S3 permite análisis de tendencias a largo plazo y creación de reportes personalizados con Athena. Para comprender en profundidad el diseño de red de Internet Monitor, los libros especializados (Amazon) son útiles.

Precios y configuración de Internet Monitor

Internet Monitor se cobra según el volumen de tráfico de los recursos monitoreados (distribuciones de CloudFront, VPC). Puede configurar el porcentaje de tráfico monitoreado del 1 al 100%, ajustando el equilibrio entre costo y cobertura. Para tráfico a gran escala, un muestreo del 10-25% proporciona precisión estadísticamente suficiente. Como se publican métricas de CloudWatch para la puntuación de disponibilidad y la puntuación de rendimiento, puede integrarlas en dashboards y alarmas de CloudWatch existentes. Ajuste los umbrales de eventos de salud para prevenir la fatiga de alertas por variaciones menores de rendimiento. Hay un límite de varias decenas de monitores por cuenta, y en entornos multi-cuenta los monitores se crean individualmente en cada cuenta.

Patrones de implementación por caso de uso

Para aplicaciones SaaS globales, monitoree CloudFront para comprender la experiencia del usuario final por región, identificando regiones con bajo rendimiento e informando decisiones sobre ubicaciones de borde adicionales o adopción de Origin Shield. Para aplicaciones web multi-región, use EventBridge + Lambda para ajustar automáticamente el enrutamiento ponderado de Route 53 cuando ocurran problemas con el enrutamiento a una región específica, desviando tráfico de la región afectada. Para aplicaciones privadas dentro de VPCs (SaaS interno, herramientas para trabajadores remotos), monitoree el tráfico VPC para detectar degradación vía ISPs específicos, proporcionando justificación para agregar gateways VPN o evaluar un cambio a AWS Direct Connect. En industrias sensibles a la latencia como finanzas y salud, configure umbrales estrictos de puntuación de rendimiento para detectar incluso degradación leve de forma inmediata.

Uso complementario con Synthetic Monitoring

CloudWatch Synthetics (Canary) es monitoreo sintético que periódicamente envía solicitudes desde puntos de sondeo para medir disponibilidad y tiempo de respuesta, complementando a Internet Monitor. Synthetics sobresale en detectar fallas del lado de la aplicación (servidor caído, bugs de código, expiración de certificados), mientras Internet Monitor detecta casos donde la aplicación está saludable pero existen problemas en la ruta hacia los usuarios. Usar ambos juntos permite determinar inmediatamente si una falla se origina en la aplicación o en la ruta de Internet, reduciendo el MTTR (Tiempo Medio de Recuperación). Synthetics es fuerte en monitoreo transaccional verificando URLs o flujos específicos mediante scripts, mientras Internet Monitor sobresale en la conciencia amplia de interrupciones de ISP/región en un área extensa.

Resumen

Internet Monitor es un servicio que visualiza el rendimiento de las aplicaciones a través de Internet por ISP y región. Detecta automáticamente fallas del lado de Internet y notifica mediante eventos de salud, proporcionando material de decisión para la optimización del tráfico combinada con el enrutamiento geográfico de Route 53 y el failover de origen de CloudFront. El uso combinado con Synthetics acelera el aislamiento de fallas, y el ajuste de la tasa de muestreo controla el equilibrio entre costo y cobertura.