Los equipos de ciencia de datos a menudo enfrentan numerosos desafíos cuando intentan llevar sus modelos desde un entorno de desarrollo hasta uno de producción. Estos problemas incluyen dificultades para integrar los modelos de los científicos de datos en el entorno de producción del equipo de TI, la necesidad de adaptar el código de ciencia de datos para cumplir con los estándares de seguridad y gobernanza de la empresa, el acceso a datos de calidad de producción y la mantención de la repetibilidad y reproducibilidad de las tuberías de aprendizaje automático. La carencia de una infraestructura de plataforma adecuada y plantillas estandarizadas dificulta aún más este proceso.
Para abordar estos retos, se presenta una nueva plataforma que promueve la autogestión mediante la provisión de entornos seguros para los equipos de aprendizaje automático. Esta plataforma acelera el desarrollo de modelos mediante plantillas predefinidas, establece un registro centralized de modelos para potenciar la colaboración y reutilización, y standardiza los procesos de aprobación y despliegue de modelos.
En este contexto, existen varios roles clave involucrados en los ciclos de vida del aprendizaje automático. El líder del equipo de ciencia de datos es responsable de gestionar las cuentas para los equipos de desarrollo, regular el acceso y fomentar procesos de desarrollo y aprobación estandarizados. Los científicos de datos realizan análisis de datos, desarrollan y evalúan modelos, y registran estos modelos en un registro dedicado. Los ingenieros de aprendizaje automático son los encargados de desarrollar y controlar los procesos de despliegue de modelos, mientras que un oficial de gobernanza revisa el rendimiento de los modelos y otorga la aprobación final para su implementación. Por su parte, los ingenieros de plataforma definen procesos estandarizados y gestionan la infraestructura necesaria para compartir artefactos de modelos.
Los beneficios de esta plataforma son varios. En primer lugar, aseguran que cada paso en el ciclo de vida del aprendizaje automático cumpla con los estándares de seguridad y gobernanza de la organización, lo que reduce significativamente el riesgo. Además, los equipos de ciencia de datos obtienen la autonomía necesaria para crear cuentas y acceder a los recursos de aprendizaje automático, minimizando así las limitaciones de recursos que a menudo obstaculizan su trabajo.
La automatización de muchos de los pasos manuales rutinarios permite a los científicos de datos enfocar su tiempo y esfuerzo en la construcción de modelos y la obtención de conocimiento a partir de los datos, en lugar de gestionar la infraestructura. Esto se complementa con un registro centralizado de modelos que mejora la colaboración entre equipos y aumenta la visibilidad de los modelos desarrollados, reduciendo la duplicación de esfuerzos.
El proceso estandarizado para la revisión y uso de modelos facilita la colaboración entre las áreas de ciencia de datos y negocios, permitiendo que los modelos sean evaluados, aprobados y desplegados rápidamente en producción, lo cual es esencial para aportar valor a la organización.
Este enfoque integral para gobernar el ciclo de vida del aprendizaje automático a gran escala logra beneficios significativos en términos de seguridad, agilidad, eficiencia y alineación entre funciones. La plataforma, diseñada con una arquitectura de múltiples cuentas, permite que diferentes roles colaboren de manera efectiva para escalar las operaciones de aprendizaje automático, contribuyendo así a una implementación más efectiva y adaptativa de soluciones de ciencia de datos en el ámbito empresarial.
vía: AWS machine learning blog