Potenciando la Búsqueda Empresarial con el Modelo de Embeddings Multimodal Cohere Embed 4 en Amazon Bedrock

0
3
Powering enterprise search with the Cohere Embed 4 multimodal embeddings model in Amazon Bedrock

La nueva incorporación de Amazon Bedrock, el modelo de incrustaciones multimodal Cohere Embed 4, ya está disponible como opción totalmente gestionada y sin servidor. Este desarrollo permite a los usuarios opt entre inferencia de región cruzada y global para manejar picos de tráfico no planeados utilizando recursos de computación en diferentes regiones de AWS. Situaciones como solicitudes de información en tiempo real y concentraciones de zonas horarias son ejemplos de eventos que pueden incrementar la demanda de inferencia.

Cohere Embed 4 está diseñado específicamente para analizar documentos empresariales, ofreciendo capacidades multilingües de primer nivel y mejoras significativas con respecto a la versión anterior, Embed 3. Su rendimiento lo convierte en una herramienta ideal para casos de uso como la búsqueda empresarial.

El modelo avanza en las capacidades de incrustaciones multimodal al admitir documentos complejos que combinan texto e imágenes, creando representaciones vectoriales unificadas. Este modelo puede manejar hasta 128,000 tokens, lo que reduce la necesidad de dividir documentos y simplifica la preparación de datos. Además, ofrece incrustaciones comprimidas que disminuyen los costos de almacenamiento de vectores en hasta un 83%. Esto resulta especialmente beneficioso para las empresas en industrias reguladas que requieren una gestión eficiente de documentos no estructurados.

Cohere Embed 4 se integra fácilmente en aplicaciones a través de la API InvokeModel, y su uso es compatible con diversas herramientas y recursos de AWS, como Strands Agents y S3 Vectors, para crear potentes flujos de trabajo de generación aumentada por recuperación (RAG).

En el ámbito de la búsqueda empresarial, este modelo desbloquea múltiples capacidades para las organizaciones, como optimizar la eficiencia del almacenamiento y mejorar los flujos de trabajo de inteligencia artificial generativa. Amazon Bedrock permite un entorno completamente sin servidor, eliminando la necesidad de gestionar infraestructura y simplificando la integración con otras capacidades.

Para iniciar con Embed 4, es fundamental verificar ciertos requisitos, como permisos de IAM y la instalación del SDK de Strands, además de configurar un bucket y un índice de vectores en S3 para almacenar y consultar datos vectoriales. El sistema de Strands Agents también proporciona un marco modular que facilita el desarrollo y la orquestación de agentes de IA.

Una vez construido y probado un agente, este puede ser desplegado en el entorno gestionado de Amazon Bedrock AgentCore, un runtime seguro diseñado específicamente para la implementación y escalado de agentes de IA dinámicos. Mediante el uso de herramientas como Amazon S3 para almacenamiento optimizado de vectores, las organizaciones pueden construir flujos de trabajo de alta calidad y seguros sin la carga de gestionar la infraestructura subyacente.

En conclusión, el modelo Embed 4 en Amazon Bedrock representa un avance significativo para las empresas que buscan aprovechar el valor de sus datos multimodales y no estructurados. Con su capacidad de manejo de un gran volumen de información y costosa infraestructura de almacenamiento, este modelo se presenta como una solución efectiva para desafíos en sectores regulados como finanzas, salud y manufactura.
vía: AWS machine learning blog