En noviembre de 2023, Amazon SageMaker lanzó una serie de mejoras a su clase ModelBuilder dentro del SDK Python, diseñado para simplificar y optimizar el proceso de implementación de modelos de aprendizaje automático (ML) a endpoints de SageMaker. Estas mejoras facilitan una transición fluida del entrenamiento a la inferencia, ofreciendo una interfaz unificada y soporte para múltiples configuraciones de despliegue.
Entre los avances más destacados, se encuentra la capacidad de integrar ModelBuilder directamente con las interfaces de entrenamiento de SageMaker, asegurando que se compute automáticamente la ruta correcta hacia el artefacto del modelo más reciente entrenado. Esto simplifica significativamente el flujo de trabajo desde el entrenamiento del modelo hasta su despliegue. Además, se ha introducido una interfaz de inferencia unificada que antes requería diferentes flujos de trabajo para inferencia en tiempo real, en lotes, sin servidor y asincrónica.
Otra de las mejoras incluye soporte para pruebas en modo local, permitiendo a los usuarios depurar y probar sus scripts de procesamiento e inferencia con mayor velocidad. También se ha añadido una función que proporciona la última imagen de contenedor para un determinado marco, evitando la necesidad de actualizar el código con cada nueva versión.
La clase ModelBuilder ahora permite personalizar los pasos de preprocesamiento y postprocesamiento de inferencias. Esto es particularmente útil para flujos de trabajo complejos que requieren ajustes antes y después de que los datos sean enviados al modelo para predicciones. Esta mejora también facilita la integración de scripts para filtrar contenido y eliminar información personal identificable (PII), encapsulando los pasos necesarios dentro de la configuración del modelo para una mejor gestión y despliegue.
Otro aspecto crucial es el soporte para la evaluación del rendimiento gracias a una nueva API de benchmarking. Esta funcionalidad permite a los usuarios evaluar opciones de despliegue mediante métricas clave de rendimiento como latencia y coste, optimizando los modelos para un desempeño óptimo antes de su producción real.
De esta manera, Amazon SageMaker busca reducir la complejidad y la sobrecarga operativa para los científicos de datos, proporcionando una interfaz sencilla e intuitiva para entrenar y desplegar modelos de manera eficaz. Con estas innovaciones, la plataforma se posiciona para abordar una amplia gama de casos de uso en el dinámico campo de la inteligencia artificial generativa.
Las mejoras en ModelBuilder, junto a las capacidades del ModelTrainer presentadas previamente, representan un avance significativo para facilitar la vida a los data scientists, permitiéndoles concentrarse en la creación de modelos más sofisticados y eficientes. SageMaker invita a explorar estas características del SDK y participaciones mediante documentación y ejemplos disponibles para su uso práctico en la plataforma.
vía: AWS machine learning blog