Construcción de mensajería asíncrona con Amazon SQS - Diseño de colas Standard y FIFO

Explicamos cómo elegir entre colas Standard y FIFO, usar DLQ para mensajes fallidos, integrar con Lambda y manejar mensajes de gran volumen.

約 7 分で読めます最終更新: 2026-05-24

Descripción general de SQS

SQS es un servicio de colas de mensajes completamente administrado. Mientras SNS proporciona fan-out de uno a muchos, SQS proporciona mensajería punto a punto de uno a uno. Desacopla el procesamiento de solicitudes de la aplicación web del procesamiento pesado del backend, mejorando la escalabilidad y la tolerancia a fallos. SQS almacena mensajes de forma redundante en múltiples zonas de disponibilidad, por lo que los mensajes no se pierden por la falla de una sola AZ. El período de retención de mensajes es de 4 días por defecto y puede extenderse hasta 14 días. El Visibility Timeout es de 30 segundos por defecto y controla cuánto tiempo un mensaje siendo procesado permanece invisible para otros consumidores.

Diseño de colas y DLQ

Las colas Standard ofrecen throughput de decenas de miles de mensajes por segundo, sin garantía de orden (orden de mejor esfuerzo). Garantizan entrega al menos una vez (at-least-once), por lo que es esencial la idempotencia en el consumidor. Las colas FIFO garantizan el orden por ID de grupo de mensajes y logran procesamiento exactly-once mediante IDs de deduplicación. El throughput es de 300 mensajes por segundo (3,000 con batching), extensible a miles por segundo con el modo de alto rendimiento. La DLQ mueve automáticamente los mensajes que han fallado el procesamiento maxReceiveCount veces, evitando que bloqueen la cola principal. Después de investigar los mensajes de la DLQ y corregir la causa raíz, se pueden reenviar (redrive) a la cola principal. El período de retención de la DLQ se puede configurar independientemente de la cola fuente; se recomienda establecer un período generoso (por ejemplo, 14 días) para la investigación.

Integración con Lambda y mensajes de gran volumen

La integración de SQS con Lambda como origen de eventos permite el procesamiento automático de mensajes con funciones Lambda. Configurando el tamaño de lote (hasta 10,000) y la ventana de lote (hasta 300 segundos), se procesan múltiples mensajes a la vez reduciendo las invocaciones de Lambda. Habilitando las respuestas de lote parcial (ReportBatchItemFailures), solo se reprocesan los mensajes fallidos dentro de un lote, evitando el procesamiento duplicado de mensajes exitosos. Con colas FIFO, la concurrencia de Lambda se limita al número de grupos de mensajes. Extended Client Library permite enviar y recibir mensajes mayores de 256 KB vía S3, soportando el procesamiento asíncrono de cargas grandes. La encriptación de mensajes se configura con SSE-SQS (gratuito) o SSE-KMS. Para profundizar en los patrones de mensajería asíncrona, libros especializados (Amazon) son una referencia útil.

Mejores prácticas de diseño y errores comunes

Configure el Visibility Timeout más largo que el tiempo máximo de procesamiento del consumidor. Si es demasiado corto, los mensajes se reenvían causando procesamiento duplicado. La idempotencia es obligatoria para consumidores de colas Standard. Use escrituras condicionales de DynamoDB o restricciones únicas de base de datos para prevenir el procesamiento duplicado. La ventana de deduplicación de FIFO es fija en 5 minutos; enviar un mensaje con el mismo ID de deduplicación dentro de 5 minutos causa que el mensaje posterior sea descartado. Siempre habilite long polling (configure WaitTimeSeconds entre 1 y 20 segundos). El short polling genera respuestas vacías frecuentes, causando cargos de solicitud innecesarios. Aproveche los atributos de mensaje (MessageAttributes) para enrutamiento y filtrado, minimizando el análisis del cuerpo del mensaje para mejorar el rendimiento del consumidor.

Consideraciones de precios y límites

Las colas Standard de SQS cuestan aproximadamente $0.40 por millón de solicitudes, y las colas FIFO cuestan $0.50 por millón. El primer millón de solicitudes al mes es gratuito. Cada solicitud maneja hasta 256 KB, contando cada bloque de 64 KB como una solicitud. Long polling (WaitTimeSeconds=20) reduce las respuestas vacías y optimiza el conteo de solicitudes. Los mensajes en DLQ se facturan a la misma tarifa que los mensajes regulares, así que procese o elimine los mensajes de DLQ periódicamente. El límite de mensajes en vuelo es 120,000 para Standard y 20,000 para FIFO. Exceder este límite devuelve un error OverLimit, por lo que diseñar el escalado del consumidor para mantener el throughput es crítico. Al usar encriptación SSE-KMS se aplican costos adicionales de llamadas a la API de KMS. Para colas de alto volumen, considere SSE-SQS (sin costo adicional).

Comparación con otros servicios de mensajería

SQS es una cola punto a punto basada en pull. SNS es pub/sub basado en push, entregando un solo mensaje simultáneamente a múltiples suscriptores. El patrón de fan-out SNS + SQS suscribe múltiples colas SQS a un tema SNS, habilitando procesamiento paralelo independiente en cada cola. Amazon MQ es una versión administrada de Apache ActiveMQ y RabbitMQ, elegido cuando se requiere compatibilidad con protocolos existentes como JMS o AMQP. EventBridge está diseñado para arquitecturas dirigidas por eventos, enrutando eventos de más de 100 servicios de AWS y aplicaciones SaaS mediante filtrado basado en reglas. SQS está optimizado para el buffering de mensajes de alto volumen y el patrón worker, destacando en eficiencia de costos y simplicidad operativa.

Resumen

SQS es un servicio para construir arquitecturas desacopladas mediante mensajería asíncrona. Las colas Standard proporcionan throughput de decenas de miles de mensajes por segundo, mientras que las colas FIFO ofrecen garantías de orden y deduplicación. Las asignaciones de origen de eventos de Lambda automatizan el procesamiento de mensajes, y las DLQ manejan los mensajes fallidos. Long polling optimiza el conteo de solicitudes, y Extended Client Library soporta mensajes mayores de 256 KB. Asegurar la idempotencia y configurar correctamente el Visibility Timeout son decisiones de diseño críticas que determinan la estabilidad en producción.

Integración de datos SaaS con Amazon AppFlow - Integración con Salesforce, Slack y Google AnalyticsSincroniza datos de Salesforce y Slack a S3 y Redshift sin código. Presenta triggers basados en eventos, enmascaramiento de PII y transferencia segura mediante PrivateLink.Automatización de integración de datos - Plataforma de integración SaaS con Amazon AppFlowIntegración de datos entre aplicaciones SaaS con Amazon AppFlow. Conecte servicios externos como Salesforce, Slack y Google Analytics con servicios AWS sin código, construyendo flujos de datos en tiempo real o programados.Arquitectura dirigida por eventos - Diseño de sistemas desacoplados con Amazon EventBridgeExplicamos cómo construir una arquitectura dirigida por eventos utilizando Amazon EventBridge.Mejores prácticas de diseño de EventBridge Pipes - Optimización de filtrado y procesamiento por lotesExplicamos mejores prácticas para el diseño de filtrado en EventBridge Pipes, la optimización del tamaño de lotes, las estrategias de manejo de errores y la mejora de la eficiencia de costos.Integración de eventos con Amazon EventBridge Pipes - Patrones de conexión entre origen y destinoConecta directamente fuentes de eventos como SQS, DynamoDB Streams y Kinesis con destinos, intercalando filtrado y enriquecimiento en los patrones de diseño.Detección de eventos IoT - Detección y respuesta automática a cambios de estado de dispositivos con AWS IoT EventsExplicamos la monitorización de estado y respuesta automática de dispositivos IoT con AWS IoT Events. Presentamos la definición de transiciones de estado con modelos de detector, la función de alarmas y la integración con SNS/Lambda.Gestión de flujos de trabajo - Operación gestionada de Apache Airflow con Amazon MWAASe explica la orquestación de pipelines de datos con Amazon MWAA (Managed Workflows for Apache Airflow). Se presenta de forma práctica desde la configuración, gestión de DAGs hasta la diferenciación con Step Functions.Operación de message broker con Amazon MQ - Selección y migración de ActiveMQ y RabbitMQExplicación de Amazon MQ como servicio de message broker gestionado. Se presenta la selección entre ActiveMQ y RabbitMQ, configuraciones de alta disponibilidad y patrones de migración.

Descripción general de SQS

Diseño de colas y DLQ

Integración con Lambda y mensajes de gran volumen

Mejores prácticas de diseño y errores comunes

Consideraciones de precios y límites

Comparación con otros servicios de mensajería

Resumen

Servicios relacionados

Artículos relacionados

Más sobre este tema

Artículos y servicios similares