Lecciones Aprendidas al Construir RAGs Reales en GenAIIC – Parte 1

0
11
From RAG to fabric: Lessons learned from building real-world RAGs at GenAIIC – Part 1

En un esfuerzo por ayudar a las empresas a incorporar la inteligencia artificial generativa de manera más eficaz, el AWS Generative AI Innovation Center (GenAIIC) ha establecido un equipo de expertos en ciencia y estrategia para desarrollar soluciones de Prueba de Concepto utilizando la Generación Aumentada por Recuperación (RAG). Desde su creación en mayo de 2023, GenAIIC ha atendido una alta demanda de chatbots capaces de extraer información y generar conocimientos a partir de bases de conocimiento extensas y heterogéneas.

RAG es un enfoque que integra modelos de lenguaje de gran tamaño con fuentes de datos externas para mejorar la relevancia y precisión de las respuestas. Este método se divide en tres procesos principales: recuperación de información relevante, aumento de esta información junto al cuestionamiento del usuario, y, finalmente, generación de respuestas informadas.

El centro ha publicado recientemente una serie de artículos orientados a guiar a sus usuarios en la implementación de RAG, comenzando por una explicación básica de su arquitectura y cómo optimizar el uso del texto en estos sistemas. Próximamente, se presentará un análisis más extenso para trabajar con múltiples formatos de datos, como tabulares y visuales.

Uno de los puntos clave discutidos es la importancia de un sistema de recuperación eficiente, ya que la capacidad de un RAG de entregar respuestas precisas depende en gran medida de la efectividad de su módulo recuperador. Se recomienda almacenar los documentos en almacenes vectoriales, donde los textos son segmentados y convertidos a vectores para facilitar búsquedas semánticas más eficaces. Sin embargo, se destaca que la búsqueda por palabras clave sigue siendo útil, especialmente cuando se trata de jerga técnica y nombres propios.

En el contexto práctico, se analizan casos de uso en ámbitos como el servicio al cliente, entrenamiento de empleados, mantenimiento industrial, búsqueda de información de productos y al resumen de noticias financieras. Estos ejemplos ilustran cómo implementar y evaluar las soluciones RAG en diferentes industrias.

Para asegurar y evaluar la calidad de la recuperación y la generación de respuestas, se proponen varias métricas, como precisión, recuerdo y evaluación por expertos. Además, el artículo sugiere métodos para mejorar la calidad de las respuestas generadas, tales como ingeniería de prompt, generación de citas, y la verificación de estas en los documentos originales.

Asimismo, GenAIIC recalca que, a pesar del potencial de los modelos de lenguaje, la calidad de las respuestas depende de la información contextual proporcionada durante la etapa de recuperación. Evaluar y optimizar la arquitectura de RAG es esencial para su éxito y adopción a gran escala.

AWS también habilita la creación de chatbots RAG mediante servicios como Amazon Bedrock Knowledge Bases vinculadas con Amazon S3, que automatiza el indexado y fragmentación de documentos, facilitando la integración de estas tecnologías para las empresas que buscan innovar con IA generativa. En un futuro cercano, se espera que estos avances abran las puertas a la gestión y utilización de datos más estructurados y visuales mediante soluciones multimodales.
vía: AWS machine learning blog