Generación De Perspectivas Específicas Para La Industria Financiera Usando IA Generativa Y Ajuste En Contexto

0
130
Generate financial industry-specific insights using generative AI and in-context fine-tuning

En la era digital actual, la capacidad de analizar datos tabulares de manera efectiva utilizando modelos de lenguaje grandes (LLMs) ha revolucionado numerosas industrias. Recientemente, un nuevo enfoque llamado Aprendizaje Generativo Tabular (GTL) ha sido propuesto como una solución innovadora que permite generar análisis precisos y relevantes de datos estructurados, utilizando un lenguaje específico de la industria.

El enfoque GTL se destaca por ofrecer resultados que se asemejan al ajuste fino de modelos de LLM, sin incurrir en la complejidad típica de estos procesos. Esta técnica facilita el uso de modelos de lenguaje preentrenados para analizar conjuntos de datos tabulares proporcionando ejemplos de contexto dentro de las indicaciones, lo que mejora la comprensión y relevancia del análisis generado.

El método fue desarrollado basándose en un documento técnico titulado «From Supervised to Generative: A Novel Paradigm for Tabular Deep Learning with Large Language Models». Utilizando JupyterLabs completamente gestionados en Amazon SageMaker, este enfoque interactúa con los modelos Meta Llama alojados en plataformas como Amazon SageMaker y Amazon Bedrock. Además, se ha habilitado el acceso a cuadernos de referencia adicionales a través de la plataforma GitHub para guiar a los usuarios en el uso de estos modelos.

Para quienes deseen implementar esta estrategia, es necesario contar con acceso a modelos LLM como los Llama de Meta, configuraciones específicas de Amazon SageMaker, así como conocimientos sobre la ingeniería de indicaciones generativas y las técnicas de evaluación de la precisión de los resultados generados.

El sector financiero, en particular, puede beneficiarse significativamente de esta tecnología. Los conjuntos de datos del sector suelen presentarse en forma de tablas, ya sea en archivos PDF o bases de datos estructuradas. Por ejemplo, uno de los datasets utilizados para probar esta solución contenía información detallada sobre fondos cotizados en bolsa (ETFs).

Un aspecto notable de este enfoque es la capacidad de un usuario para formular preguntas relacionadas con el negocio o la industria de manera que el modelo LLM pueda generar una respuesta adecuada usando lenguajes específicos del sector. Por ejemplo, puede responder a consultas sobre los ETFs más seguros con rendimientos de dividendos más altos y menor volatilidad, utilizando datos como el rendimiento y la volatilidad de cinco, tres, y un año.

La propuesta de un marco GTL como una solución intermedia antes de considerar el ajuste fino de modelos proporciona un camino a seguir que es más simple y, potencialmente, más rentable. Permite a las organizaciones generar salidas más específicas de la industria a partir de las LLM mediante la fabricación de conjuntos curados de instrucciones GTL que detallan características y etiquetas relevantes.

Este enfoque puede ser especialmente valioso al crear aplicaciones interactivas que permitan a los usuarios comerciales, que quizá no sean expertos en la manipulación de grandes datasets, obtener insights significativos mediante preguntas en lenguaje natural.

En conclusión, aunque los modelos de lenguaje grandes continúan mejorando, persiste un espacio significativo para la optimización del análisis de datos estructurados con técnicas como GTL. Las organizaciones pueden así abordar sus necesidades específicas de análisis sin recurrir inmediatamente al costoso y laborioso proceso de ajuste fino de modelos.
vía: AWS machine learning blog