Cómo MSD Utiliza Amazon Bedrock para Traducir Lenguaje Natural en SQL para Bases de Datos Complejas en el Sector Salud

0
59
How MSD uses Amazon Bedrock to translate natural language into SQL for complex healthcare databases

En un novedoso intento por transformar el acceso y análisis de datos en el sector de la salud, la inteligencia artificial generativa (Generative AI) está revolucionando la forma en que las organizaciones de salud interactúan con su vasta cantidad de datos. Gracias a los modelos de lenguaje a gran escala (LLMs, por sus siglas en inglés), ahora es posible obtener valiosos conocimientos a partir de datos estructurados almacenados en sistemas de gestión de bases de datos relacionales (RDBMS), mediante la generación de consultas SQL complejas a partir de preguntas formuladas en lenguaje natural. Este avance no solo permite un análisis de datos más accesible para personas con diferentes niveles de habilidad, sino que también empodera a las organizaciones para tomar decisiones basadas en datos de manera más veloz.

La farmacéutica global Merck & Co., Inc., conocida como MSD, ha sido pionera en implementar esta tecnología colaborando con el Centro de Innovación en Generación AI de Amazon (GenAIIC). Este socio tecnológico ha contribuido al desarrollo de una solución de texto a SQL que facilita significativamente la extracción de datos complejos de bases de datos del sector salud. Antes de esta colaboración, un gran número de analistas y científicos de datos dedicaban una cantidad de tiempo considerable a crear manualmente consultas SQL, retrasando así la productividad y la toma de decisiones informadas dentro de la organización. Ahora, con esta nueva solución, un analista solo necesita preguntar, por ejemplo, «¿Cuántas pacientes mujeres fueron admitidas en un hospital en 2008?» y el sistema generará automáticamente la consulta SQL adecuada, lo que potencialmente puede reducir el tiempo de creación de consultas de horas a minutos. Este enfoque no solo ahorra tiempo, sino que también democratiza el acceso a los datos, permitiendo que incluso el personal no técnico pueda extraer información rápidamente, mejorando la productividad general de la organización y acelerando la toma de decisiones informadas.

A pesar de que algunos modelos de lenguaje pueden generar código SQL, la creación de un flujo de trabajo de texto a SQL efectivo requiere exactitud en las indicaciones y podría no ser viable con todos los modelos. Es esencial incluir toda la información de la base de datos necesaria para escribir consultas ejecutables, ya que este contexto es crucial para generar sentencias SQL precisas y específicas del esquema.

El sistema construido por MSD emplea el modelo Claude 3.5 Sonnet de Anthropic en Amazon Bedrock, un servicio administrado que ofrece modelos de generación de alto rendimiento de compañías líderes de inteligencia artificial. Para demostrar las capacidades de la solución, se ha utilizado el conjunto de datos de acceso público Data Entrepreneurs’ Synthetic Public Use File (DE-SynPUF), que ofrece una estructura de datos de salud realista y sin comprometer la privacidad del paciente.

Llevar el acceso a los datos a nuevas alturas en el sector salud es pieza clave en la competitividad del futuro, y el uso estratégico de la inteligencia artificial generativa es el camino indicado para superar los desafíos de acceso a la información y análisis ágil de datos. Esta innovación no solo representa un avance tecnológico, sino también un paso significativo hacia mejores resultados para los pacientes y una excelencia operativa en el sector salud.
vía: AWS machine learning blog