Entrenamiento Acelerado de Redes Neuronales en Grafos Distribuidos con GraphStorm v0.4

0
90
Faster distributed graph neural network training with GraphStorm v0.4

AWS ha anunciado la disponibilidad de GraphStorm v0.4, una actualización de su marco de aprendizaje automático (ML) de gráficos que promete mejorar significativamente la eficiencia en el procesamiento de datos a gran escala en empresas. Esta nueva versión introduce la integración con DGL-GraphBolt, un marco de almacenamiento y muestreo de gráficos diseñado para optimizar el entrenamiento e inferencia de redes neuronales gráficas (GNN). Según se informa, GraphStorm puede acelerar la inferencia en un 360% y el entrenamiento por época en un 140%, lo que plantea un avance notable en el desempeño de las tareas de aprendizaje automático en gráficos.

GraphStorm es una plataforma de bajo código que permite a los profesionales del ML construir, entrenar y desplegar soluciones de ML sobre datos de gráficos de gran escala. En esta nueva versión, se han abordado desafíos clave que enfrentan los modelos de aprendizaje de gráficos, tales como las restricciones de memoria y la necesidad de muestreo eficiente. Por ejemplo, GraphStorm v0.4 ofrece un almacenamiento distribuido y compacto de estructuras de gráficos que pueden llegar a ocupar varios terabytes, lo que facilita el manejo de conjuntos de datos masivos.

GraphBolt, la nueva incorporación a GraphStorm, utiliza una representación de gráficos más compacta y aplica un muestreo en tuberías, lo que reduce los requerimientos de memoria y acelera los procesos de entrenamiento e inferencia. Con un ejemplo específico, se demostró que para un conjunto de datos de gran escala, el tiempo de entrenamiento se ha reducido de manera significativa, permitiendo que los investigadores y desarrolladores obtengan resultados más rápidos y eficientes.

La solución también se alinea bien con el entorno de Amazon SageMaker, permitiendo a los usuarios hacer la transición de pruebas locales a entrenamientos a gran escala de manera sencilla y gestionada. Utilizando SageMaker, los usuarios pueden desarrollar modelos en instancias de EC2 y luego mover el trabajo pesado al entorno distribuido de SageMaker, optimizando así su flujo de trabajo y reduciendo gastos operativos.

AWS invita a los profesionales del aprendizaje automático a explorar estas nuevas características de GraphStorm, subrayando que la plataforma simplifica el proceso de modelado, permitiendo a los usuarios centrarse más en la investigación y menos en la infraestructura.
vía: AWS machine learning blog