Construcción de render farm administrado con AWS Deadline Cloud - Migración de renderizado VFX a la nube

Explicamos la construcción de render farms con Deadline Cloud, la programación de trabajos y la optimización de costos mediante instancias Spot.

Descripción general de Deadline Cloud

Deadline Cloud es un servicio que proporciona render farms administrados en la nube para VFX y animación, con capacidad de escalar hasta miles de nodos. Los render farms on-premises tenían problemas de alta inversión inicial, falta de capacidad en picos e inactividad en períodos de baja demanda, pero Deadline Cloud los resuelve con escalado automático según el volumen de trabajos y facturación por uso. Soporta herramientas DCC principales incluyendo Maya, Houdini, Blender, 3ds Max, Nuke y Cinema 4D, y proporciona definiciones de trabajos estandarizadas a través de OpenJD (Open Job Description) para flujos de trabajo independientes del renderer.

Programación de trabajos y optimización de costos

Se crean colas en el farm y se asocian flotas (grupos de workers) a las colas. Las flotas pueden tener una configuración mixta de instancias On-Demand y Spot, reduciendo costos al aumentar la proporción de Spot. Se puede establecer la prioridad de los trabajos para procesar renderizados urgentes de forma prioritaria. Los plugins de submitter de herramientas DCC permiten enviar trabajos directamente desde las estaciones de trabajo de los artistas y verificar el progreso en el dashboard. La función de presupuesto establece límites mensuales por farm para prevenir excesos de gasto. Cuando el consumo del presupuesto alcanza el umbral, la programación de nuevos trabajos se detiene automáticamente mientras los trabajos en progreso continúan hasta completarse.

Diseño de flotas de workers y almacenamiento

Las flotas de workers de Deadline Cloud son de dos tipos: flotas administradas por el servicio y flotas administradas por el cliente. En las flotas administradas por el servicio, las instancias EC2 se aprovisionan automáticamente según los requisitos del trabajo y se terminan al completar el renderizado. Se pueden especificar instancias GPU (G5, G6) para renderizado con GPU e instancias CPU (C6i, C7i) para renderizado con CPU. Las flotas administradas por el cliente permiten preinstalar licencias de software y plugins específicos usando AMIs personalizadas. Para la transferencia de datos de escenas y texturas de gran tamaño, se utiliza S3 como almacenamiento de adjuntos de trabajo, y los workers descargan automáticamente al iniciar el trabajo. Al montar FSx for Lustre, múltiples workers pueden acceder al sistema de archivos compartido con alto throughput, referenciando eficientemente los assets comunes entre frames. Para explicaciones detalladas sobre Deadline Cloud, también puede consultar los libros relacionados en Amazon.

Gestión de costos de Deadline Cloud

Deadline Cloud se factura por uso de los recursos de cómputo utilizados para el renderizado. Al especificar instancias Spot en la flota de workers, se pueden reducir significativamente los costos de renderizado. Los trabajos de renderizado son tolerantes a interrupciones, por lo que un diseño que reanude desde checkpoints cuando se interrumpe una instancia Spot es efectivo. La función de presupuesto permite establecer un límite mensual por farm, previniendo excesos presupuestarios. Aprovechando la prioridad de programación de trabajos, se pueden procesar shots urgentes con instancias On-Demand y ejecutar renderizados de preview con Spot, logrando una operación eficiente en costos. Los informes de uso permiten rastrear los costos de renderizado por proyecto y mejorar la precisión de las estimaciones.

Comparación con render farms on-premises

Los render farms on-premises requieren inversión inicial en racks de servidores, equipos de refrigeración, infraestructura eléctrica y equipos de red. El hardware aprovisionado para la demanda pico genera recursos excedentes inactivos durante períodos no pico. Con Deadline Cloud, los cargos de recursos de cómputo caen a cero cuando no hay trabajos, siendo adecuado para estudios con alta variabilidad entre períodos ocupados y tranquilos. Sin embargo, para estudios grandes que esperan una utilización consistentemente alta (aproximadamente 70% o más durante todo el año), la comparación de costos debe considerar Instancias Reservadas o Savings Plans. También es posible una configuración híbrida donde el renderizado base se procesa on-premises y solo la capacidad de ráfaga pico se descarga a Deadline Cloud. Usando el agente Deadline Cloud Monitor, los workers on-premises pueden unirse a las colas de Deadline Cloud para una gestión unificada de recursos en la nube y on-premises.

Consideraciones de precios y cuotas

El precio de Deadline Cloud se compone principalmente del tiempo de actividad de los workers (cargos EC2) y el volumen de transferencia S3 para adjuntos de trabajos. Con flotas administradas por el servicio, la facturación cubre el tiempo desde el lanzamiento hasta la terminación del worker, y al enviar grandes cantidades de trabajos de renderizado de corta duración, la sobrecarga de inicio del worker se vuelve relativamente significativa. En este caso, configurar MinWorkerCount para mantener un número mínimo de workers siempre en ejecución evita tiempos de espera de inicio, aunque se aplican cargos por tiempo inactivo. Para transferencias S3 de adjuntos de trabajos, los costos de transferencia de datos se vuelven no despreciables cuando los archivos de escena son grandes, haciendo efectiva una configuración de caché con FSx for Lustre. Existen cuotas de servicio para el máximo de workers por flota y trabajos concurrentes por cola; las producciones a gran escala necesitan enviar solicitudes de aumento de cuota con anticipación.

Resumen

Deadline Cloud es un render farm administrado basado en la nube que procesa trabajos de renderizado de VFX y animación con escalado automático. Las flotas administradas por el servicio eliminan la necesidad de gestionar EC2, y las instancias Spot junto con la función de presupuesto controlan los costos mientras se logra renderizado paralelo a gran escala. Soporta herramientas DCC principales y permite la construcción flexible de pipelines de renderizado a través de definiciones de trabajos estandarizadas con OpenJD.