Construye una Base de Conocimiento Justo a Tiempo con Amazon Bedrock

0
43
Multi-tier AWS serverless architecture diagram showcasing data flow and integration of various AWS services

Las empresas de Software como Servicio (SaaS) que gestionan múltiples inquilinos enfrentan un desafío crucial: extraer eficientemente información significativa de vastas colecciones de documentos mientras controlan los costos. Los enfoques tradicionales a menudo dan como resultado gastos innecesarios en recursos de almacenamiento y procesamiento no utilizados, afectando tanto la eficiencia operativa como la rentabilidad. Por lo tanto, las organizaciones requieren soluciones que escalen inteligentemente los recursos de procesamiento y almacenamiento en función de los patrones de uso reales de los inquilinos, al tiempo que se mantiene la aislamiento de datos.

Los sistemas tradicionales de Recuperación Aumentada por Generación (RAG) consumen recursos valiosos al mantener embeddings de documentos que pueden nunca ser consultados. Esto se traduce en costos de almacenamiento innecesarios y una eficiencia reducida del sistema. Además, los sistemas diseñados para manejar grandes cantidades de inquilinos pequeños a medianos pueden superar los límites de estructura de costos e infraestructura o necesitar implementaciones en forma de silos para mantener la información y el uso de cada inquilino separados. Para complicar aún más este panorama, muchos proyectos son de naturaleza transitoria, con trabajos que se completan de manera intermitente, llevando a que los datos ocupen espacio en sistemas de bases de conocimiento que podrían ser utilizados por otros inquilinos activos.

Para abordar estos desafíos, se ha presentado una solución de base de conocimiento justo a tiempo que reduce el consumo no utilizado mediante un procesamiento inteligente de documentos. Esta solución solo procesa documentos cuando es necesario y elimina automáticamente los recursos no utilizados, permitiendo a las organizaciones escalar sus repositorios de documentos sin incrementar proporcionalmente los costos de infraestructura.

Con una arquitectura multi-inquilino y límites configurables por inquilino, los proveedores de servicios pueden ofrecer modelos de precios escalonados mientras mantienen una estricta separación de datos. La expiración automática de documentos a través del Tiempo de Vida (TTL) asegura que el sistema se mantenga ágil y centrado en el contenido relevante, mientras que la actualización del TTL para documentos frecuentemente accedidos mantiene un rendimiento óptimo. Esta arquitectura también permite limitar la cantidad de archivos que cada inquilino puede ingresar en un momento específico y la tasa a la cual pueden consultar un conjunto de archivos.

La solución, diseñada con tecnologías sin servidor, busca aliviar la carga operativa y proporcionar escalado automático, permitiendo que los equipos se concentren en la lógica del negocio en lugar de en la gestión de infraestructura. Al organizar documentos en grupos con filtrado basado en metadatos, el sistema facilita consultas contextuales que ofrecen resultados más relevantes al tiempo que mantiene las fronteras de seguridad entre inquilinos. La flexibilidad de la arquitectura permite la personalización de configuraciones de inquilinos, tasas de consulta y políticas de retención de documentos, adaptándose a las necesidades empresariales en evolución sin una reestructuración significativa.

En resumen, la solución de base de conocimiento justo a tiempo presentada ha transformado la gestión de documentos en múltiples inquilinos al procesar documentos solo cuando son consultados, reduciendo el consumo no utilizado de los sistemas RAG tradicionales. Esta implementación sin servidor utiliza Amazon Bedrock, OpenSearch Serverless y la función TTL de DynamoDB para crear un sistema ágil con gestión inteligente del ciclo de vida de documentos, límites configurables para inquilinos y una estricta separación de datos, lo cual es esencial para proveedores SaaS que ofrecen modelos de precios escalonados.
vía: AWS machine learning blog