Despliega Modelos Meta Llama 3.1 de Manera Económica en Amazon SageMaker JumpStart con AWS Inferentia y Trainium

Por

26 de noviembre de 2024

366

La empresa tecnológica Meta ha anunciado la disponibilidad de Meta Llama 3.1, un modelo de lenguaje de alta capacidad, en la plataforma de Amazon Web Services (AWS). Esta integración, que incluye modelos de 8 mil millones (8B) y 70 mil millones (70B) de parámetros, se implementa en instancias de AWS Trainium e Inferentia a través de la interfaz Amazon SageMaker JumpStart.

Meta Llama 3.1 representa un avance significativo en la tecnología de modelos de lenguaje generativo. Estos modelos, diseñados para manejar texto en múltiples idiomas, han demostrado superar a muchos otros modelos de código abierto en pruebas de la industria. Este despliegue a través de AWS busca no solo mejorar el rendimiento, sino también optimizar costos, reduciéndolos hasta un 50% con respecto al uso tradicional de GPU.

La característica destacada del Meta Llama 3.1 es su arquitectura transformadora optimizada, que ha sido ajustada con técnicas como el ajuste fino supervisado y el aprendizaje por refuerzo con retroalimentación humana. Estas metodologías buscan alinear la generación de texto con las preferencias humanas en términos de utilidad y seguridad. Además, se han introducido variantes para mejorar el uso de herramientas automatizadas, lo que permite al modelo realizar tareas como generación de imágenes, búsqueda, ejecución de código y razonamiento matemático.

Amazon SageMaker JumpStart proporciona un entorno seguro y personalizable para el despliegue de estos modelos, permitiendo a los desarrolladores trabajar en una nube privada virtual para garantizar la seguridad de datos. Los usuarios pueden acceder a los modelos a través de un entorno de desarrollo interactivo o programar su implementación mediante el SDK de Python de SageMaker. Esto ofrece flexibilidad a los desarrolladores en la integración con flujos de trabajo y tuberías de aprendizaje automático existentes.

Con un diseño fácil de usar, SageMaker JumpStart permite la implementación en un clic y ajustes adicionales a través de notebooks de ejemplo, ofreciendo orientación paso a paso para el despliegue y la optimización. Esto respalda la misión de democratizar el acceso a herramientas avanzadas de inteligencia artificial, habilitando a empresas y profesionales a descubrir nuevas formas de innovación en sus flujos de trabajo.

El despliegue de Meta Llama 3.1 en AWS representa un hito hacia la eficiencia y el ahorro de costos en el manejo de modelos generativos a gran escala. Además, refuerza el compromiso de ambas empresas por hacer que el poder de las soluciones de inteligencia artificial esté más al alcance de todos.
vía: AWS machine learning blog

Despliega Modelos Meta Llama 3.1 de Manera Económica en Amazon SageMaker JumpStart con AWS Inferentia y Trainium

SOBRE NOSOTROS

SÍGUENOS