Generar Consultas Gremlin Usando Modelos de Amazon Bedrock

0
2
Generate Gremlin queries using Amazon Bedrock models

Las bases de datos grafos han transformado la manera en que las organizaciones gestionan datos complejos e interconectados. Sin embargo, lenguajes de consulta especializados como Gremlin a menudo representan un obstáculo para los equipos que buscan extraer información de manera eficiente. A diferencia de las bases de datos relacionales tradicionales que poseen esquemas bien definidos, las bases de datos grafos carecen de un esquema centralizado, lo que demanda una profunda experiencia técnica para realizar consultas efectivas.

Para abordar este desafío, se ha propuesto un enfoque que convierte consultas en lenguaje natural en consultas Gremlin, utilizando modelos de Amazon Bedrock como Amazon Nova Pro. Este método facilita que analistas de negocio, científicos de datos y otros usuarios no técnicos accedan e interactúen con bases de datos grafos sin dificultad.

El proceso de generación de consultas a partir de lenguaje natural se desglosa en tres pasos clave. En primer lugar, es fundamental entender y extraer el conocimiento del gráfico, lo que incluye etiquetas de vértices, propiedades y conexiones entre ellos. Este paso se complementa con el conocimiento del dominio, que aporta contexto adicional adaptado a la aplicación específica, y se obtiene a través de descripciones generadas por modelos de lenguaje.

El segundo paso implica estructurar el gráfico, creando un esquema similar al procesamiento de texto a SQL, que mejora la comprensión del modelo sobre las estructuras gráficas. En este contexto, cada consulta en lenguaje natural pasa por un proceso de reconocimiento de entidades, enriquecimiento de contexto y planificación de consultas.

Finalmente, el tercer paso es generar y ejecutar consultas Gremlin. Un modelo de lenguaje genera una consulta inicial que se ejecuta en un motor Gremlin, y en caso de error, se aplican mecanismos de análisis para refinar la consulta. Este proceso iterativo garantiza que las consultas generadas se alineen con la estructura y las restricciones de la base de datos, mejorando su precisión y usabilidad.

Se ha implementado un sistema de evaluación basado en modelos de lenguaje para analizar la calidad de las consultas generadas y sus resultados de ejecución. A través de pruebas con 120 preguntas, se ha demostrado que este framework puede diferenciar efectivamente consultas correctas de incorrectas, logrando una precisión general del 74.17%.

Los resultados también indicaron que Amazon Nova Pro supera a un modelo de referencia en términos de latencia y costos, generando consultas más rápidamente y a un menor costo por token. De cara al futuro, se están realizando mejoras para optimizar la evaluación automática de resultados y manejar de manera más efectiva consultas anidadas. Estas innovaciones prometen aumentar aún más la fiabilidad y consistencia de las salidas del framework, facilitando el aprovechamiento de las bases de datos grafos para un amplio rango de aplicaciones empresariales.
vía: AWS machine learning blog