Mejorando la Precisión de la Generación Aumentada por Recuperación con GraphRAG

0
30
Improving Retrieval Augmented Generation accuracy with GraphRAG

En un contexto donde las decisiones empresariales están cada vez más fundamentadas en datos, la integridad y la precisión de la información se han convertido en aspectos clave. Muchos clientes están buscando mejorar la exactitud de las aplicaciones de inteligencia artificial generativa, y una de las estrategias más eficaces es mediante la implementación de sistemas de recuperación basados en vectores y el patrón arquitectónico conocido como Generación Aumentada por Recuperación (RAG). Este enfoque integra embebidos densos para proporcionar un contexto relevante a las salidas de la inteligencia artificial. Sin embargo, cuando se requiere aún más precisión y fidelidad contextual, se introduce una solución avanzada: el RAG mejorado por grafos (GraphRAG), que utiliza estructuras gráficas para ofrecer capacidades mejoradas de razonamiento y modelado de relaciones.

Lettria, socio de AWS, ha evidenciado que la integración de estructuras basadas en grafos en los flujos de trabajo de RAG puede aumentar la precisión de las respuestas en hasta un 35% en comparación con los métodos de recuperación basados únicamente en vectores. La clave de este incremento radica en la capacidad de los grafos de modelar relaciones y dependencias complejas entre puntos de datos, ofreciendo así una base más matizada y contextualmente precisa para las salidas de la inteligencia artificial generativa.

El foco de los nuevos desarrollos se centra en cómo los grafos pueden capturar consultas humanas complejas. Las preguntas formuladas por los usuarios suelen requerir la conexión de múltiples piezas de información, lo que puede ser un desafío para las representaciones de datos tradicionales. Los grafos, al estar diseñados para reflejar el pensamiento humano natural, preservan las ricas relaciones entre las entidades, lo que permite una interpretación de datos más alineada con los procesos de pensamiento humano.

Adicionalmente, el enfoque en la precisión de GraphRAG se complementa con evidencias de pruebas realizadas por Lettria, que mostraron un aumento en la corrección de las respuestas desde un 50% con RAG tradicional a más del 80% mediante GraphRAG. Este trabajo abarcó conjuntos de datos en sectores como finanzas, salud, industria y derecho, proporcionando una amplia gama de aplicaciones.

Para probar la efectividad de esta metodología híbrida, Lettria llevó a cabo una serie de benchmarks que compararon su solución GraphRAG, que utiliza tanto almacenes vectoriales como gráficos, con un RAG de referencia basado solo en vectores. En estos evaluaciones se sometieron preguntas de diferentes tipos, demostrando que un enfoque que combina las fortalezas de ambos sistemas puede mejorar significativamente la capacidad del RAG para manejar consultas complejas.

Además, AWS se presenta como un aliado robusto para implementar aplicaciones de inteligencia artificial generativa, ofreciendo una gama completa de herramientas y servicios. Con la plataforma AWS, se puede acceder a servicios avanzados como Amazon Neptune, un servicio de base de datos gráfica totalmente gestionado, que facilita la modelización y navegación de relaciones complejas dentro de los datos.

La integración de GraphRAG dentro del ecosistema de AWS y con la solución de Lettria simplifica la ingesta y procesamiento de conjuntos de datos complejos, mejorando la precisión de las tareas de respuesta a preguntas en un 35%. Las soluciones gestionadas permiten a las empresas aprovechar infraestructuras escalables y flexibles para adaptarse a las crecientes demandas de datos.

La conclusión es clara: para las empresas que adoptan aplicaciones de inteligencia artificial generativa, la precisión de los datos es un asunto crítico. Grafos como parte del flujo de trabajo RAG ofrecen una representación más rica y matizada, esencial para abordar la complejidad de las preguntas del mundo real y en consecuencia, mejorar la toma de decisiones basada en datos.
vía: AWS machine learning blog