El pronóstico de series temporales se ha convertido en una piedra angular para la toma de decisiones en diversas industrias, desde la predicción del flujo de tráfico hasta la estimación de ventas. La capacidad de realizar predicciones precisas permite a las organizaciones tomar decisiones informadas, mitigar riesgos y asignar recursos de manera eficiente. Sin embargo, los enfoques tradicionales de aprendizaje automático a menudo requieren ajustes extensos y una personalización específica del modelo, lo que resulta en un desarrollo prolongado y que consume muchos recursos.
En este contexto surge Chronos, una innovadora familia de modelos de series temporales que utiliza la potencia de las arquitecturas de modelos de lenguaje grandes (LLM) para superar estas limitaciones. Como modelo fundamental, Chronos se ha preentrenado en grandes y diversos conjuntos de datos, lo que le permite generalizar sus capacidades de pronóstico a través de múltiples dominios. Este enfoque innovador permite a Chronos destacarse en pronósticos «zero-shot», es decir, predicciones realizadas sin un entrenamiento específico en el conjunto de datos objetivo, superando a modelos específicos en la mayoría de los conjuntos de datos evaluados.
Chronos se basa en una observación clave: tanto los LLM como el pronóstico de series temporales buscan decodificar patrones secuenciales para predecir eventos futuros. Esta similitud permite tratar los datos de series temporales como un lenguaje a ser modelado mediante arquitecturas de transformadores. Para hacer esto posible, Chronos convierte los datos de series temporales continuas en un vocabulario discreto mediante un proceso de dos etapas que implica escalar los datos y cuantizarlos en un número fijo de contenedores equidistantes.
En esta instancia, se llevará a cabo la integración de Chronos en Amazon SageMaker Pipeline utilizando un conjunto de datos sintético que simula un escenario de pronóstico de ventas. Esto desbloqueará predicciones precisas y eficientes con un mínimo de datos. Los interesados podrán aprender a utilizar características que orquestan todo el flujo de trabajo, desde la sintonización hasta el despliegue, lo que permitirá optimizar el proceso de desarrollo y aplicar Chronos a cualquier dato de series temporales.
Para quienes deseen seguir el proceso, se requiere acceso a un dominio de SageMaker con los permisos de AWS Identity and Access Management necesarios para la creación y gestión de recursos. SageMaker Pipelines permitirá orquestar experimentos de entrenamiento y evaluación, facilitando la ejecución de múltiples iteraciones de experimentos simultáneamente y reduciendo tanto el tiempo de procesamiento como los costos asociados.
Una vez finalizado el modelo de pronóstico, este será desplegado mediante los servicios de alojamiento de SageMaker, donde se creará un punto de acceso para realizar predicciones en tiempo real. Esto permitirá una integración fluida con aplicaciones y sistemas, ofreciendo acceso bajo demanda a las capacidades predictivas del modelo a través de una interfaz HTTPS segura.
El rendimiento del modelo Chronos se ha evaluado sobre 27 conjuntos de datos no utilizados durante su entrenamiento, mostrando su efectividad en predicciones zero-shot frente a modelos estadísticos locales y modelos específicos de tareas. Los resultados destacaron la capacidad de Chronos para generalizar y adaptarse a situaciones no previamente entrenadas.
Con esta innovación, Chronos y su integración con Amazon SageMaker representan un avance significativo para las empresas de diversos sectores, facilitando la implementación de técnicas avanzadas de pronóstico de series temporales, sin que se requiera una amplia experiencia interna en aprendizaje automático, mejorando así la toma de decisiones y la eficiencia operativa.
vía: AWS machine learning blog