Los recientes avances en el campo de la inteligencia artificial generativa, especialmente en tecnologías de generación de medios, están transformando rápidamente la forma en que las empresas crean y manipulan contenido visual. Uno de los actores clave en este cambio es Amazon Bedrock, un servicio totalmente gestionado que ofrece modelos fundamentales de alto rendimiento de empresas líderes en IA como AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI y Amazon, a través de una única API. Este servicio permite a las empresas personalizar modelos, afinar sus capacidades, y realizar generación aumentada por recuperación (RAG) de manera segura y con responsabilidad.
En el ámbito empresarial, estas capacidades pueden ser aprovechadas para mejorar la experiencia del usuario y generar contenido multimedia como imágenes, diagramas, infografías o formas personalizadas. Además, es posible evaluar la confianza en el contenido generado utilizando modelos de evaluación preentrenados y adaptados, con datos y parámetros propios de la organización.
Recientemente, Amazon ha introducido el Amazon Titan Image Generator G1 v2 en Bedrock. Este modelo exclusivo incorpora 25 años de experiencia de Amazon en innovación con inteligencia artificial y aprendizaje automático, permitiendo a los creadores de contenido generar imágenes de alta calidad de manera rápida a partir de simples indicaciones en inglés. El generador devuelve imágenes con calidad de estudio, adecuadas para publicidad, comercio electrónico y entretenimiento. La nueva versión G1 v2 amplía las capacidades de la original, permitiendo guiar la creación de imágenes con imágenes de referencia, editar visuales existentes, eliminar fondos, generar variaciones de imágenes y personalizar el modelo de manera segura para mantener la consistencia de la marca y los sujetos.
Otro lanzamiento relevante es el de Anthropic Claude 3.5 Sonnet, un modelo que establece nuevos estándares en la industria por su inteligencia, superando a otros modelos generativos en una amplia gama de evaluaciones. Disponible también en Amazon Bedrock, ofrece la rapidez y el costo del modelo original, pero con mejoras significativas en razonamiento a nivel de posgrado y en la comprensión de instrucciones complejas.
El flujo de trabajo para interactuar con estos modelos en Amazon Bedrock implica el envío de un prompt como una solicitud API que es procesada por una función AWS Lambda. Esta función llama a Amazon Bedrock para generar una imagen basada en el prompt con Amazon Titan Image Generator G1 v2 y posteriormente evalúa esta imagen usando el modelo Claude 3.5 Sonnet para describirla, puntuarla y sugerir mejoras. La imagen generada se almacena en Amazon S3 con un enlace pre-firmado proporcionado como respuesta.
La solución completa se implementa en la región AWS us-east-1 y está diseñada para integrarse fácilmente con las infraestructuras existentes mediante un archivo de plantilla de AWS CloudFormation. Este tipo de innovaciones refuerzan el potencial de la inteligencia artificial generativa en la automatización y personalización de tareas creativas dentro de las empresas.
vía: AWS machine learning blog