Casos de Uso de IA Generativa a Gran Escala, Parte 1: Arquitectura Hub y Radio Multitenencia Usando AWS Transit Gateway

0
47
Scale generative AI use cases, Part 1: Multi-tenant hub and spoke architecture using AWS Transit Gateway

La inteligencia artificial generativa sigue transformando la manera en que las empresas abordan la innovación y la resolución de problemas. A medida que los clientes avanzan de la experimentación a la escalabilidad de los casos de uso de inteligencia artificial generativa en sus organizaciones, se observa una creciente integración de estas tecnologías en los procesos centrales de las empresas. Esta evolución abarca diversas líneas de negocio, equipos y proveedores de software como servicio (SaaS). Sin embargo, a medida que los clientes de AWS adoptan más estas tecnologías, surgen nuevos desafíos relacionados con la gestión efectiva y la escalabilidad de las implementaciones.

Entre los principales obstáculos están la necesidad de abstraer y reutilizar preocupaciones comunes como la multi-tenencia, la autenticación, la autorización y la red segura. Una arquitectura de múltiples cuentas resulta beneficiosa para los proveedores de SaaS que sirven a varios clientes empresariales y organizaciones que enfrentan requisitos de cumplimiento estrictos. Esta arquitectura no solo mejora la organización y la seguridad del entorno de AWS, sino que también permite gestionar de manera más eficiente las preocupaciones comunes a medida que las implementaciones de inteligencia artificial generativa se expanden.

En una serie de dos partes, se presenta un patrón de arquitectura de hub y spoke para construir una arquitectura multi-tenant y multi-cuenta. En la primera parte, se describe un hub centralizado para las abstracciones de servicios de inteligencia artificial generativa, complementado por «spokes» específicos para cada inquilino, utilizando AWS Transit Gateway para la interoperabilidad entre cuentas. Esta cuenta central actúa como el punto de entrada para las solicitudes de los usuarios finales, centralizando funciones compartidas esenciales como la autenticación y la toma de decisiones de enrutamiento.

En la segunda parte de la serie, se abordará una variación de esta arquitectura utilizando AWS PrivateLink para compartir de manera segura el punto de acceso centralizado en la cuenta del hub con los equipos de la organización o con socios externos. El enfoque principal en ambas publicaciones es la centralización de la autenticación, la autorización y el acceso a modelos, junto con redes seguras entre múltiples cuentas para facilitar la incorporación y escalamiento de casos de uso de inteligencia artificial generativa.

Esta solución se basa en la implementación de una arquitectura de hub y spoke que ofrece un sistema seguro y escalable para gestionar las implementaciones de inteligencia artificial generativa a través de múltiples cuentas. La cuenta hub funciona como una cuenta central que proporciona servicios comunes a través de los inquilinos y actúa como punto de entrada para las solicitudes de los usuarios finales. En contraste, las cuentas spoke contienen recursos específicos para cada inquilino, como roles de permisos y recursos de Amazon Bedrock. Esta arquitectura permite que las solicitudes fluyan de manera centralizada, manteniendo la separación entre inquilinos.

Entre las consideraciones de diseño, se destaca la elección de utilizar funciones Lambda en la cuenta hub para la validación de tokens y la lógica de enrutamiento, lo que facilita la centralización de la gestión de la lógica empresarial, así como la monitorización y el registro. Esta flexibilidad permite a las organizaciones adaptar la arquitectura a sus necesidades específicas y posibles extensiones futuras.

Con el aumento en la adopción de arquitecturas multi-tenant y las nuevas capacidades de AWS, las organizaciones pueden crear soluciones robustas que aprovechen al máximo el potencial de la inteligencia artificial generativa, al mismo tiempo que abordan los desafíos de escalabilidad y seguridad inherentes a su implementación.
vía: AWS machine learning blog