El modelo de base sólida Cohere Rerank 3 Nimble ya está disponible en Amazon SageMaker JumpStart. Este modelo es el más reciente de la serie Rerank de Cohere, diseñado para mejorar la búsqueda de empresas y los sistemas de Generación Aumentada por Recuperación (RAG).
El modelo Cohere Rerank 3 Nimble se ha desarrollado para reordenar documentos recuperados por algoritmos de búsqueda iniciales según su relevancia para una consulta dada. Este tipo de modelo, conocido también como cross-encoder, produce una puntuación de similitud entre un par de consulta y documento. Mediante la cuantificación de la similitud semántica a través del cálculo del coseno del ángulo entre vectores densos, los resultados se reordenan por relevancia.
La principal ventaja de Cohere Rerank 3 Nimble es su velocidad y eficiencia mejoradas en comparación con su predecesor, Cohere Rerank 3, manteniendo altos niveles de precisión. Las pruebas de referencia de Cohere muestran una mejora de velocidad de tres a cinco veces, lo que lo hace ideal para empresas que buscan mejorar sus capacidades de búsqueda sin sacrificar el rendimiento.
La plataforma SageMaker JumpStart de Amazon ofrece acceso a una amplia selección de modelos preentrenados que se pueden personalizar para casos de uso específicos. Esta plataforma facilita el ciclo de vida completo de machine learning (ML), desde la preparación de datos hasta la implementación y monitorización de modelos.
Para desplegar Cohere Rerank 3 Nimble, es necesario asegurarse de que el rol de servicio IAM de SageMaker tenga la política de permisos AmazonSageMakerFullAccess. Además, es crucial confirmar la suscripción al modelo a través de AWS Marketplace o contar con los permisos necesarios para efectuar suscripciones.
El modelo puede accederse a través de Amazon SageMaker Studio, y su despliegue empieza seleccionando la opción «Deploy». Tras finalizar el despliegue, se crea un endpoint que puede probarse mediante una solicitud de inferencia u opciones de prueba usando el SDK.
Cohere Rerank 3 Nimble ofrece soporte multilingüe robusto, con versiones en inglés y multilingües que soportan más de 100 idiomas. Esto permite a las organizaciones globales mejorar sus experiencias de búsqueda de manera consistente en diferentes regiones y preferencias de idioma.
En el contexto del comercio minorista, donde cada incremento de 100 milisegundos en el tiempo de respuesta de búsqueda puede aumentar la tasa de abandono del sitio web, el modelo Cohere Rerank 3 Nimble se traduce en tasas de conversión más altas gracias a su velocidad optimizada.
Cohere Rerank 3 y Rerank 3 Nimble están disponibles ahora en SageMaker JumpStart. Para comenzar, se recomienda consultar la documentación y ejemplos detallados en el sitio oficial de Amazon SageMaker y el repositorio GitHub «Cohere on AWS».
vía: AWS machine learning blog