AWS DataSync Especializado2018年〜
Un servicio que automatiza y acelera la transferencia de datos entre entornos on-premises y AWS
Qué hace
AWS DataSync es un servicio de transferencia de datos que automatiza y acelera el movimiento de datos entre almacenamiento on-premises y servicios de almacenamiento de AWS (S3, EFS, FSx). Utiliza un protocolo de transferencia optimizado que es hasta 10 veces más rápido que herramientas de código abierto. Maneja automáticamente la verificación de integridad, el cifrado en tránsito y la programación de transferencias.
Casos de uso
Se utiliza para migración de datos de centros de datos a AWS, replicación continua para recuperación ante desastres, transferencia de datos para procesamiento en la nube (análisis, ML), archivado de datos fríos a S3 Glacier, y sincronización entre diferentes servicios de almacenamiento AWS.
Analogía cotidiana
Piensa en él como un servicio de mudanzas especializado en datos. En lugar de mover cajas (archivos) una por una en tu coche (scripts manuales), contratas una empresa de mudanzas (DataSync) con camiones grandes (protocolo optimizado) que empaca todo de forma segura, verifica que nada se dañó en el camino y entrega todo en el nuevo hogar (AWS).
¿Qué es AWS DataSync?
AWS DataSync es un servicio de transferencia de datos administrado que simplifica y acelera el movimiento de grandes volúmenes de datos. Mientras que herramientas como rsync o scripts personalizados requieren gestión manual de errores, reintentos y verificación, DataSync maneja todo automáticamente con rendimiento optimizado.
Agente y transferencia
Para transferencias desde on-premises, despliegas un agente de DataSync (máquina virtual) en tu centro de datos. El agente se conecta a tu almacenamiento de origen (NFS, SMB, HDFS, objetos) y transfiere datos a AWS usando un protocolo optimizado con compresión y paralelismo. Para transferencias entre servicios AWS, no se necesita agente.
Programación y verificación
DataSync permite programar transferencias periódicas (cada hora, día, semana) para mantener los datos sincronizados. Verifica automáticamente la integridad de los datos comparando checksums de origen y destino. Soporta filtros para incluir/excluir archivos específicos y preserva metadatos (permisos, timestamps). Para más detalles sobre migración de datos, los libros en Amazon son útiles.
Cómo empezar
Para transferencias desde on-premises: despliega el agente DataSync como VM (VMware, Hyper-V, KVM o EC2). Crea una ubicación de origen (NFS/SMB share) y una ubicación de destino (bucket S3, sistema EFS). Crea una tarea de transferencia y ejecútala. Para transferencias entre servicios AWS, simplemente crea las ubicaciones y la tarea sin agente.
Aspectos a tener en cuenta
- オンプレミス環境に DataSync エージェント用の仮想マシン (VMware、Hyper-V、KVM 対応) が必要。エージェントのリソース要件を事前に確認すること
- 転送データ量に対する従量課金のため、大量データの初回移行ではコストを事前に見積もること
- AWS 間 (例: S3 から EFS) の転送ではエージェント不要で、コンソールから直接タスクを作成できる