Modelos Mistral-NeMo Ahora Disponibles en SageMaker JumpStart

0
86
Mistral-NeMo-Instruct-2407 and Mistral-NeMo-Base-2407 are now available on SageMaker JumpStart

Hoy se anunció oficialmente la disponibilidad de los modelos de lenguaje Mistral-NeMo-Base-2407 y Mistral-NeMo-Instruct-2407 a través de Amazon SageMaker JumpStart. Estos modelos, desarrollados por Mistral AI en colaboración con NVIDIA, cuentan con doce mil millones de parámetros y son capaces de generar textos de alta calidad en múltiples lenguajes. Los interesados pueden acceder a estos modelos a través de SageMaker JumpStart, una plataforma que ofrece un hub de aprendizaje automático proporcionando acceso directo a algoritmos y modelos que pueden implementarse con un simple clic para realizar inferencias.

Los modelos Mistral NeMo destacan por su capacidad para manejar contenido extenso gracias a su ventana de contexto de 128k tokens y su eficacia en tareas de razonamiento, conocimiento mundial y precisión en codificación. Además, estos modelos son compatibles con varios idiomas, como inglés, francés, alemán, español, italiano, portugués, chino, japonés, coreano, árabe e hindi, lo que mejora su accesibilidad a nivel global. Una característica notable es su tokenizador Tekken, que permite una compresión más eficiente del texto en lenguaje natural y código fuente, mejorando la eficiencia en más de cien idiomas.

SageMaker JumpStart, por su parte, es un servicio gestionado que brinda modelos preentrenados para distintos usos, tales como generación de contenido, respuestas a preguntas, redacción de copias, y mucho más. La incorporación de Mistral-NeMo-Base-2407 y Mistral-NeMo-Instruct-2407 en su catálogo permitirá a las empresas y a los investigadores desarrollar aplicaciones de aprendizaje automático de forma más rápida y sencilla, aprovechando las capacidades avanzadas de estos modelos.

La implementación de estos modelos se puede hacer fácilmente mediante Amazon SageMaker Studio, utilizando el SDK de Python de SageMaker. Este enfoque permite a los usuarios derivar el rendimiento del modelo y controlar las operaciones de aprendizaje automático de manera segura, gracias al entorno protegido de AWS. Los usuarios también tienen la opción de cambiar configuraciones predeterminadas para personalizar la implementación según sus necesidades específicas.

Para aquellos interesados en explorar las capacidades instruccionales del modelo NeMo, este ofrece herramientas eficaces para la generación de código y la comprensión de tareas matemáticas avanzadas, entre otras. Con la eficiencia de procesamiento del tokenizador Tekken, es posible lograr mejoras significativas en la reducción de uso de tokens en aplicaciones exigentes, como la traducción de idiomas y la generación de textos extensos.

Este desarrollo reafirma el compromiso de Mistral AI y Amazon de facilitar el acceso a tecnologías avanzadas de inteligencia artificial y aprendizaje automático, brindando herramientas poderosas y versátiles que pueden adaptarse a diversas necesidades empresariales y de investigación a nivel global.
vía: AWS machine learning blog