Hoy se han lanzado los nuevos modelos de razonamiento de NVIDIA, Llama 3.3 Nemotron Super 49B V1 y Llama 3.1 Nemotron Nano 8B V1, disponibles a través de Amazon Bedrock Marketplace y Amazon SageMaker JumpStart. Estos avances permiten a las organizaciones construir, experimentar y escalar de manera responsable sus ideas de inteligencia artificial generativa en la plataforma AWS.
La integración de los micronservicios de inferencia NVIDIA NIM facilita el despliegue de modelos de IA generativa, apoyándose en servicios gestionados de AWS. Estas soluciones están diseñadas para acelerar la implementación de modelos de IA, permitiendo a los desarrolladores integrar aplicaciones de IA generativa con solo un comando o unas pocas líneas de código.
El Llama 3.3 Nemotron Super 49B V1 es una versión optimizada que utiliza un enfoque de Búsqueda de Arquitectura Neuronal (NAS) para reducir su huella de memoria y aumentar la eficiencia. Este modelo ofrece un impresionante soporte para contextos de hasta 128,000 tokens, facilitando tareas complejas como la generación aumentada de datos y la llamada a herramientas. Por su parte, el Llama 3.1 Nemotron Nano 8B V1 mantiene características similares, siendo más compacto y utilizando capacidades mejoradas con un modelo más pequeño que se puede usar localmente.
Amazon Bedrock Marketplace proporciona una experiencia unificada y segura para acceder a modelos de IA, permitiendo a las organizaciones encontrar lo que más se ajusta a sus necesidades. Los modelos están disponibles para una amplia variedad de aplicaciones, desde la redacción de contenidos hasta la clasificación de información.
Para empezar a utilizar estos modelos, los usuarios solo necesitan suscribirse a ellos en Amazon Bedrock y seguir unos sencillos pasos para desplegarlos, pudiendo realizar inferencias directamente en la consola de Bedrock o a través del SDK de SageMaker.
Como conclusión, la llegada de los modelos Llama 3.3 y Llama 3.1 representa un avance significativo en la capacidad de las empresas para implementar soluciones avanzadas de AI. Gracias a la infraestructura escalable de AWS, las empresas pueden desplegar estos modelos de manera fácil y rápida, transformando sus aplicaciones de inteligencia artificial con tecnologías de vanguardia.
vía: AWS machine learning blog