AWS ha lanzado la versión 0.4 de GraphStorm, una actualización relevante de su plataforma dedicada al aprendizaje automático de gráficos, prometiendo un significativo aumento de eficiencia en el procesamiento de datos a gran escala para diversas empresas. Esta versión renovada integra DGL-GraphBolt, un sistema avanzado de almacenamiento y muestreo de gráficos, que tiene como objetivo optimizar tanto el entrenamiento como la inferencia de redes neuronales gráficas (GNN).
La actualización de GraphStorm trae consigo una prometedora mejora de desempeño, donde la inferencia se acelera hasta un 360% y el entrenamiento por época incrementa su velocidad en un 140%. Este avance representa una evolución importante en la eficiencia de las tareas de aprendizaje automático en gráficos, enfrentando eficazmente las limitaciones de memoria y la necesidad de un muestreo más eficiente.
GraphStorm se presenta como una plataforma de bajo código diseñada para que los expertos en aprendizaje automático puedan construir, entrenar y desplegar soluciones basadas en gráficos a gran escala. En esta nueva versión, se atienden problemas clave del aprendizaje de gráficos, introduciendo un almacenamiento distribuido y compacto capaz de manejar estructuras que pueden llegar a tener varios terabytes, facilitando así la administración de voluminosos conjuntos de datos.
GraphBolt, ahora parte integral de GraphStorm, emplea una representación más compacta de los gráficos y utiliza el muestreo en tuberías para reducir los requerimientos de memoria y acelerar procesos de entrenamiento e inferencia. En las pruebas realizadas, esta tecnología ha permitido reducir considerablemente el tiempo de entrenamiento para conjuntos de datos de gran escala, ofreciendo a investigadores y desarrolladores resultados más rápidos y eficientes.
La integración de esta solución con Amazon SageMaker es otro de sus puntos fuertes, permitiendo a los usuarios pasar de pruebas locales a entrenamientos a gran escala de forma segura y gestionada. Gracias al uso de SageMaker, se puede desarrollar modelos en instancias de EC2 y trasladar las cargas más pesadas al entorno distribuido de SageMaker, optimizando el flujo de trabajo y reduciendo costos operativos.
AWS anima a los profesionales del área a explorar las nuevas funciones de GraphStorm, resaltando cómo la plataforma facilita el proceso de modelado y permite a los usuarios centrarse prioritariamente en la investigación sobre la infraestructura.