Predicción de demanda con Amazon Forecast - Ingesta de datos de series temporales y mejora de la precisión
Explicamos la construcción de modelos de predicción de series temporales con Forecast, el uso de datos relacionados y la exportación de resultados de predicción.
Desafios de la prediccion de demanda y posicionamiento de Forecast
La prediccion de demanda es un desafio critico en industrias como retail, logistica, manufactura y energia. Los metodos estadisticos tradicionales (media movil, suavizado exponencial, ARIMA) son relativamente faciles de implementar pero tienen limitaciones para capturar patrones complejos como estacionalidad, tendencias y efectos de factores externos. Los enfoques basados en deep learning (DeepAR, Transformer) logran alta precision pero requieren experiencia en ML y ajuste de modelos. Amazon Forecast es un servicio gestionado que selecciona automaticamente el algoritmo optimo via AutoML y genera predicciones de alta precision simplemente importando datos de series temporales. Aprovecha los mismos algoritmos de ML utilizados para la prediccion de demanda en Amazon.com, permitiendo predicciones de alta precision sin experiencia en ML. Proporciona predicciones probabilisticas con intervalos P10, P50 y P90, apoyando la toma de decisiones consciente del riesgo a traves de la cuantificacion de la incertidumbre.
Preparacion de datos y construccion de modelos
El uso de Forecast comienza con la importacion de datos en Dataset Groups. La serie temporal objetivo (obligatoria) son los datos a predecir, compuestos por tres columnas: timestamp, ID de articulo y valor (cantidad de ventas, volumen de demanda). La serie temporal relacionada (opcional) incluye factores externos como datos meteorologicos, informacion de promociones y cambios de precios. Los metadatos de articulos (opcional) incluyen atributos como categoria, marca y color, utilizados para compartir patrones entre articulos similares. Los datos se colocan en S3 en formato CSV, y una definicion de esquema (JSON) especifica el tipo de atributo y tipo de datos para cada columna. La granularidad de timestamp (1 min/5 min/15 min/1 hora/1 dia/1 semana/1 mes/1 ano) se configura segun los requisitos del negocio y debe coincidir con la unidad del horizonte de prediccion. AutoML construye modelos con 6 algoritmos - DeepAR+, Prophet, ETS, NPTS, ARIMA y CNN-QR - y selecciona automaticamente el mas preciso mediante backtesting.
Predicciones probabilisticas y analisis What-If
Forecast proporciona no solo predicciones puntuales (valor unico) sino tambien predicciones probabilisticas (incluyendo incertidumbre). Genera predicciones en tres cuantiles: P10 (10% de probabilidad de que la demanda caiga por debajo), P50 (mediana), y P90 (90% de probabilidad de que la demanda caiga por debajo). En gestion de inventario, se puede usar P50 para cantidades de pedido estandar y P90 para stock de seguridad. Productos donde el riesgo de desabastecimiento es inaceptable usan pedidos basados en P90, mientras que productos donde se prioriza minimizar costos de inventario usan pedidos basados en P50, apoyando la toma de decisiones especifica del negocio. El analisis What-If genera predicciones de escenarios como "demanda si se ejecutan promociones el proximo mes" o "demanda si los precios se reducen un 10%." Se pueden evaluar multiples escenarios con valores modificados de series temporales relacionadas en paralelo para evaluar cuantitativamente el impacto de las iniciativas. Para tecnicas practicas sobre Forecast, tambien puede consultar libros relacionados en Amazon.
Mejora de la precision de prediccion
La precision de prediccion de Forecast depende en gran medida de la calidad de los datos de entrada y la riqueza de los datos relacionados. Agregar datos de series temporales relacionadas (clima, festivos, promociones) permite que el modelo aprenda fluctuaciones de demanda causadas por factores externos, mejorando la precision. Forecast incluye informacion integrada de festivos (featurizacion de Holidays) que automaticamente considera festivos principales simplemente especificando un codigo de pais. Los metadatos de elementos (categoria, marca, rango de precio) son efectivos para mitigar el problema de arranque en frio (predecir demanda de productos nuevos), estimando patrones de demanda desde el rendimiento de articulos similares. Los resultados de backtest del Predictor proporcionan metricas de precision incluyendo WAPE (Error Porcentual Absoluto Ponderado), RMSE (Raiz del Error Cuadratico Medio) y MAPE (Error Porcentual Absoluto Medio) para la evaluacion cuantitativa de calidad del modelo. Si la precision es insuficiente, se puede mejorar agregando series temporales relacionadas, preprocesamiento de datos (completar valores faltantes, eliminar valores atipicos) o cambiando la frecuencia de prediccion.
Casos de uso y aplicaciones industriales
Forecast se utiliza en una amplia gama de industrias incluyendo retail, manufactura, logistica y energia. En retail, la prediccion de demanda a nivel SKU optimiza la ubicacion de inventario, reduciendo tanto el exceso de stock como el desabastecimiento. En manufactura, la prediccion de cantidades de pedido de materias primas crea planes de adquisicion que consideran los tiempos de entrega, contribuyendo a la optimizacion de costos en toda la cadena de suministro. En logistica, la prediccion de demanda de turnos de trabajadores optimiza la dotacion de personal, previniendo falta de personal en periodos pico y exceso en periodos lentos. En la industria energetica, la prediccion de consumo electrico apoya la planificacion de generacion y la gestion de red que acomoda la variabilidad de produccion de energias renovables. Para servicios web, se aplica a la planificacion de capacidad de servidores, optimizando configuraciones de auto-scaling basadas en predicciones de trafico.
Consideraciones de precios y cuotas
Los precios consisten en 0.60 USD por 1,000 predicciones, 0.24 USD por hora de entrenamiento y 0.088 USD por GB por mes de almacenamiento. Para generar predicciones de demanda mensuales para 1,000 articulos, los costos comienzan en unos pocos dolares por mes. AutoML entrena multiples modelos por lo que los costos de entrenamiento son mayores que al especificar un algoritmo manualmente. Si la precision es suficiente, reduzca costos cambiando la frecuencia de entrenamiento de semanal a mensual. Comparado con construir modelos de prediccion personalizados con SageMaker, Forecast reduce significativamente el esfuerzo de desarrollo y la carga de gestion de infraestructura. En cuanto a cuotas, el numero de dataset groups por cuenta esta limitado a 500, y los predictors estan limitados a 500 por region. El tamano de importacion de datasets tiene un limite de 10 GB, y el horizonte de prediccion depende de la granularidad con un maximo de 500 pasos temporales. El tiempo de entrenamiento para datasets grandes (millones de filas) puede requerir varias horas, asi que deje margen en los cronogramas operacionales.
Resumen
Forecast es un servicio gestionado que construye automaticamente modelos ML a partir de datos de series temporales para proporcionar predicciones de demanda. Supera las limitaciones de los metodos estadisticos tradicionales mediante ML, con AutoML seleccionando automaticamente el modelo optimo de 6 algoritmos. Agregar datos de series temporales relacionadas e informacion integrada de festivos mejora la precision de prediccion, mientras que las predicciones probabilisticas proporcionan intervalos P10/P50/P90. El analisis What-If apoya la toma de decisiones basada en escenarios, aplicable en industrias desde la optimizacion de inventario retail hasta la planificacion de adquisiciones en manufactura y gestion de redes energeticas. Si se han acumulado al menos un ano de datos historicos de ventas, se recomienda evaluar la precision de prediccion con Forecast.