GigaSpaces, con más de dos décadas en el ámbito de la gestión de datos, se especializa en soluciones de software en tiempo real para operaciones críticas. A lo largo de estos años, han aprendido que el acceso a datos estructurados es fundamental para todas las empresas, independientemente de su tamaño o sector. Desde grandes corporaciones hasta pequeñas startups, cada organización depende de datos estructurados, ya sea en bases de datos tradicionales, hojas de Excel o archivos CSV.
La definición de «tiempo real» varía entre empresas; para algunas, significa accesos en milisegundos, mientras que para otras, horas pueden ser aceptables. Sin embargo, la expectativa de un acceso rápido y confiable permanece constante. El verdadero desafío radica en que, aunque los datos estén estructurados, a menudo se encuentran fragmentados a través de diferentes sistemas, almacenados en bases de datos obsoletas o protegidos por infraestructuras mal configuradas.
La complejidad aumenta cada vez que se añaden más soluciones en forma de ETL, almacenes de datos, lagos de datos y capas de caché, lo que a menudo resulta en un aumento de la latencia y un mayor riesgo de error. En este contexto, la inteligencia de negocios (BI) ha sido tradicionalmente la herramienta clave para visualizar y entender datos, pero GigaSpaces sostiene que esto ya no es suficiente. Las plataformas de BI limitan la perspectiva de los datos a lo que ha sido previamente extraído y cargado, lo que significa que información crítica puede no estar disponible.
Los analistas actuales necesitan la capacidad de interactuar con los datos de manera más dinámica. GigaSpaces está orientando sus esfuerzos a la implementación de tecnologías de procesamiento de lenguaje natural (NLP) y consultas en lenguaje natural (NLQ), que permiten a los usuarios formular preguntas simples y obtener respuestas inmediatas. Esto sería un cambio radical en comparación al modelo tradicional, donde las consultas requerían conocimientos técnicos y a menudo implicaban esperar días para recibir una respuesta.
Una de las innovaciones propuestas es el uso de la generación aumentada de recuperación (RAG), que permite a las empresas interrogar sus datos no estructurados de manera más eficiente. Sin embargo, estos enfoques a menudo operan sobre datos no actualizados, lo que puede ser problemático en sectores donde la inmediatez de la información es crucial, como la salud y la gestión de activos.
Para superar estas limitaciones, GigaSpaces propone el concepto de Generación Aumentada de Tablas (TAG), que adapta los principios de RAG para trabajar sobre metadatos estructurados. Esto permite a las empresas construir un mapa semántico unificado que integra datos de múltiples bases sin necesidad de acceder directamente a ellos, facilitando así el trabajo en diferentes lenguajes y vocabularios, adaptándose a las necesidades específicas de cada unidad de negocio.
A medida que las empresas se enfrentan a expectativas cada vez más altas en términos de velocidad y accesibilidad, el futuro de la gestión de datos se centra en capacitar a todos los usuarios para obtener respuestas en tiempo real, simplificando la interacción y reduciendo la complejidad. Tecnologías como NLQ y TAG representan un cambio de paradigma que transforma los datos de ser un obstáculo a convertirse en un verdadero motor de negocio.
vía: AI Accelerator Institute