La adopción de la inteligencia artificial generativa entre diversas industrias está revolucionando aplicaciones como la edición de imágenes, un recurso esencial en sectores como el diseño gráfico, marketing y redes sociales. Tradicionalmente, los usuarios han dependido de herramientas especializadas para esta tarea, cuya implementación personalizada puede resultar compleja. Sin embargo, servicios de AWS permiten desplegar rápidamente una solución sin servidor para editar imágenes, ofreciendo acceso a modelos fundacionales de edición de imágenes a través de Amazon Bedrock.
Amazon Bedrock es un servicio gestionado que ofrece modelos fundacionales (FMs) de startups líderes en inteligencia artificial y de Amazon a través de una API. Elegir el modelo más adecuado para cada caso de uso es sencillo con Bedrock, que además es completamente sin servidor, lo que facilita su rápida personalización e integración en aplicaciones, sin gestión de infraestructura necesaria.
Dentro de esta plataforma, el Generador de Imágenes Titan de Amazon G1 permite generar imágenes a partir de texto, o modificar imágenes preexistentes. Este modelo incluye características clave como inpainting, para reconstruir partes de la imagen eliminadas, y outpainting, que extiende la imagen más allá de sus límites originales.
Un nuevo enfoque simplifica el despliegue de una aplicación web para edición de imágenes utilizando los servicios sin servidor de AWS. Se emplean servicios como AWS Amplify, Amazon Cognito, Amazon API Gateway y AWS Lambda, junto con Amazon Bedrock y el Generador de Imágenes Titan para construir una aplicación que permite editar imágenes mediante indicaciones escritas. Esta solución no solo destaca por reducir la complejidad de la implementación, sino también por integrar de manera efectiva los diversos servicios, ofreciendo una herramienta completa y sofisticada para la edición de imágenes.
En la arquitectura de esta solución, Amazon Cognito se utiliza para la autenticación de usuarios y Amplify sirve como entorno de alojamiento para la aplicación frontend. La combinación de API Gateway y una función Lambda constituye los servicios backend, mientras que Amazon Bedrock integra el modelo FM permitiendo a los usuarios editar imágenes a través de indicaciones.
Para implementar esta solución, se requiere la utilización de una plantilla AWS CloudFormation, que prepara todos los recursos necesarios como los de Amazon Cognito, Lambda, y API Gateway, incluidos los roles y políticas de acceso necesarios. Además, requiere la descarga y configuración del código frontend desde un repositorio de GitHub, seguido de su despliegue manual en AWS Amplify.
Una vez desplegada, la aplicación permite operaciones básicas de edición de imagen. Comienza con la creación de una máscara en una imagen elegida, seguida de la redacción de una indicación descriptiva para modificar la imagen según lo deseado. Finalmente, proporciona la posibilidad de descargar o generar nuevas versiones de la imagen según se ajustan las indicaciones.
La implementación de esta herramienta es un ejemplo de cómo las soluciones basadas en servicios administrados de AWS pueden ofrecer potentes capacidades tecnológicas sin requerir de una gestión compleja de infraestructura, permitiendo a las organizaciones centrarse en la creación y la innovación.
vía: AWS machine learning blog