Mistral Large 2 Ya Disponible en Amazon Bedrock

0
132
Mistral Large 2 is now available in Amazon Bedrock

Mistral AI ha anunciado que su modelo fundacional Mistral Large 2 (24.07) está ahora disponible en Amazon Bedrock. Esta versión más reciente del modelo Mistral Large ofrece mejoras significativas en capacidades multilingües, de razonamiento, matemáticas, codificación, y más.

Mistral Large 2 es un avanzado modelo de lenguaje grande (LLM) con destacadas habilidades en razonamiento, conocimiento y codificación. Por diseño, es multilingüe, admitiendo decenas de idiomas como inglés, francés, alemán, español, italiano, chino, japonés, coreano, portugués, holandés, polaco, árabe e hindi. Según Mistral AI, se ha dedicado un gran esfuerzo para mejorar las capacidades de razonamiento del modelo y reducir su tendencia a generar información incorrecta. Esto se logró afinando el modelo para ser más cauteloso y proporcionando salidas fiables y precisas. Además, Mistral Large 2 está entrenado para reconocer cuando no puede encontrar soluciones o no tiene suficiente información para dar una respuesta confiada.

El modelo también destaca en codificación, entrenado en más de 80 lenguajes de programación como Python, Java, C, C++, JavaScript, Bash, Swift y Fortran. Con sus avanzadas capacidades de agente, puede realizar llamadas a funciones y generar salidas en formato JSON, permitiendo una interacción fluida con sistemas externos, API y herramientas. Sus avanzadas capacidades de razonamiento y matemáticas hacen de Mistral Large 2 un recurso poderoso para enfrentar desafíos complejos.

Mistral Large 2 también ofrece una ventana de contexto incrementada de 128,000 tokens, comparada con los 32,000 tokens de su predecesor, Mistral Large (24.02). Esta ampliación es crucial para los desarrolladores ya que permite al modelo procesar y entender textos más largos sin perder contexto o coherencia. Este avance es particularmente útil para tareas como generación de código, análisis de documentación o cualquier aplicación que requiera procesar grandes cantidades de texto.

Otro aspecto destacado de Mistral Large 2 es su capacidad para generar salidas en formato JSON, facilitando a los desarrolladores la integración de estas respuestas en diversas aplicaciones y sistemas. Esta capacidad, junto con la posibilidad de usar la API Converse y herramientas de uso, permite a los modelos manejar tareas específicas y respuestas complejas.

En términos de soporte multilingüe, Mistral Large 2 abarca un amplio espectro de idiomas, incluidos aquellos basados en caracteres como el chino, japonés, coreano, árabe e hindi. Este soporte mejorado permite a los desarrolladores crear aplicaciones y servicios que pueden atender a usuarios de variados orígenes lingüísticos, proporcionando una experiencia fluida y localizada.

Por ejemplo, Mistral Large 2 puede convertir una solicitud de usuario en un JSON bien estructurado, correcta y eficientemente. En otro ejemplo, el modelo puede identificar y utilizar herramientas específicas para responder a preguntas sobre horarios de trenes en Japón, demostrando su utilidad y precisión en respuestas contextuales.

Con capacidades expandidas en tareas de codificación, Mistral Large 2, entrenado en una variedad de lenguajes de programación, asiste a los desarrolladores en la generación de código, depuración, refactorización y otras tareas de programación. Su habilidad para manejar proyectos complejos en diversos dominios lo hace una herramienta valiosa para desarrolladores trabajando en una amplia gama de aplicaciones.

El modelo Mistral Large 2 ya está disponible en la región US West (Oregon) a través de Amazon Bedrock. Para comenzar a usarlo, se puede acceder a la consola de Amazon Bedrock y, para más información detallada, referirse a la documentación disponible.
vía: AWS machine learning blog