Meta ha dado un paso audaz hacia adelante en el ámbito de los modelos de lenguaje de gran escala (LLMs) de código abierto con el lanzamiento de Llama 3.1. Esta actualización del modelo de 405 mil millones de parámetros se posiciona como una seria competencia frente a los modelos de inteligencia artificial líderes en la actualidad, destacándose en áreas como conocimientos generales, dirigibilidad, matemáticas, uso de herramientas y traducción multilingüe.
Llama 3.1 es una herramienta poderosa que permite a los desarrolladores explorar nuevas ideas en la investigación de inteligencia artificial. Su conocimiento mejorado, flexibilidad y capacidad de manejar múltiples idiomas lo hacen ideal para este propósito. La nueva versión no solo mejora el razonamiento y las capacidades de codificación, sino que también extiende su longitud de contexto a 128,000. Además, Meta ha mejorado sus modelos multilingües de 8B y 70B.
En pruebas comparativas, Llama 3.1 ha competido de manera destacada con modelos industriales como GPT-4, GPT-40 y Claude 3.5 Sonnet, especialmente en tareas que incluyen matemáticas, razonamiento y codificación. Para alcanzar este rendimiento, Meta entrenó el modelo con 15 billones de tokens, utilizando un impresionante despliegue de más de 16,000 GPUs H100.
Llama 3.1 presenta una serie de características atractivas para los desarrolladores:
- Uso de herramientas y RAG (Generación Aumentada por Recuperación): Permite ampliar el modelo utilizando herramientas en modo "zero-shot" y construir comportamientos inteligentes con RAG.
- Multilingüe: Capaz de traducir texto a cualquier idioma con el prompt adecuado.
- Razonamiento complejo: Facilita tareas de razonamiento detallado.
- Asistentes de codificación: Apoyo en la creación de códigos para construir modelos intrincados o aplicaciones de IA.
- Inferencia: Ofrece servicios de inferencia en tiempo real o por lotes, con posibilidades de descarga de pesos de modelo para optimización.
- Ajuste fino: Adaptación y personalización de la aplicación según lo necesite.
Mark Zuckerberg, CEO y cofundador de Meta, ha enfatizado la importancia de la IA de código abierto en su blog, señalando que el lanzamiento de Llama 3.1 y los modelos mejorados de 70B y 8B de Llama marcan un nuevo estándar en la industria, permitiendo un mejor equilibrio entre costo y rendimiento en comparación con los modelos cerrados.
Los desarrolladores pueden aprovechar las capacidades avanzadas del modelo 405B de Llama 3.1 desde el primer día, ya que Meta ha optimizado su ecosistema para apoyar a la comunidad de desarrolladores en la creación de proyectos innovadores. Zuckerberg afirma que el uso de soluciones de código abierto ofrece ventajas significativas en áreas como la capacitación y el ajuste fino de modelos personalizados, el control y la seguridad de los datos, la eficiencia y la rentabilidad, y la inversión en un ecosistema con longevidad.
Con Llama 3.1 disponible y un robusto ecosistema en marcha, las posibilidades para la innovación y el impacto positivo en la sociedad son inmensas. “El código abierto garantizará que más personas en todo el mundo tengan acceso a los beneficios y oportunidades de la IA,” concluye Zuckerberg.
Meta’s release of Llama 3.1 es un hito significativo para la IA de código abierto, empoderando a una gama más amplia de desarrolladores para explorar el potencial de la IA con un enfoque en la innovación y el desarrollo responsable.
vía: AI Accelerator Institute