Implementación Multi-tenant RAG con Bases de Conocimiento de Amazon Bedrock

0
138
Multi-tenant RAG with Amazon Bedrock Knowledge Bases

En un mundo donde la personalización es clave para el éxito, las organizaciones buscan constantemente formas de aprovechar el conocimiento propietario y su experiencia en el sector para obtener una ventaja competitiva. Con la llegada de modelos de base (FMs) y sus notables capacidades de procesamiento del lenguaje natural, se ha abierto una nueva oportunidad para desbloquear el valor de sus activos de datos.

Las empresas están integrando cada vez más la inteligencia artificial generativa para ofrecer experiencias personalizadas a sus clientes. Especializar el comportamiento de los FMs con sus propios datos y los de sus usuarios se convierte en una tarea crucial. En este sentido, la Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) ha surgido como un método simple pero efectivo para lograr la especialización deseada.

En este contexto, Amazon Bedrock Knowledge Bases ofrece una capacidad completamente gestionada que simplifica la gestión de todo el flujo de trabajo RAG. Esta solución permite a las organizaciones proporcionar información contextual a los FMs y agentes desde fuentes de datos privadas, logrando respuestas más relevantes y precisas que se adaptan a sus necesidades específicas.

Para desarrolladores de productos multiarrendatarios, como los proveedores de software independiente (ISVs) que crean ofertas de software como servicio (SaaS), la capacidad de personalizar experiencias para cada uno de sus clientes es especialmente significativa. La implementación de RAG permite usar selectivamente datos específicos de cada arrendatario, abordando desafíos como el aislamiento de datos, la seguridad, la gestión de los arrendatarios y la gestión de costos.

La arquitectura RAG integrada en la aplicación de los ISVs ofrece ejemplos concretos de cómo lograr esta personalización. Un componente crítico es el almacenamiento de datos en bases de vectores, donde Amazon OpenSearch Service se utiliza actualmente. Sin embargo, esta arquitectura puede adaptarse a otras implementaciones similares.

Al diseñar un sistema RAG multiarrendatario, las organizaciones deben considerar el aislamiento de los arrendatarios, la variabilidad, la simplicidad de gestión de arrendatarios y la rentabilidad. Equilibrar estos factores es vital para la eficacia de la solución. Los patrones propuestos de silo, pool y puente ofrecen diferentes niveles de aislamiento y personalización, adaptándose a distintas necesidades y casos de uso.

El patrón de silo destaca por su nivel de aislamiento, implementando una infraestructura completamente separada para cada arrendatario. Aunque es más costoso, proporciona la mayor independencia arquitectónica y seguridad de los datos. Por otro lado, el patrón de pool, caracterizado por compartir la arquitectura RAG entre todos los arrendatarios, optimiza costos sin embargo limita la personalización específica por arrendatario. Finalmente, el patrón de puente representa un equilibrio entre los dos anteriores, facilitando la personalización y ofreciendo una mayor optimización de costos comparado al patrón de silo.

Estos enfoques permiten a las organizaciones adaptar su arquitectura tecnológica de manera que puedan ofrecer un servicio cada vez más personalizado, asegurando la satisfacción del cliente y aprovechando al máximo sus recursos y datos disponibles.
vía: AWS machine learning blog