Creación de Personajes y Storyboards Coherentes con Amazon Nova en Amazon Bedrock – Parte 2

0
2
Build character consistent storyboards using Amazon Nova in Amazon Bedrock – Part 2

Un nuevo enfoque en la creación de guiones gráficos animados utiliza la inteligencia artificial para lograr una notable consistencia visual entre personajes. La técnica, basada en la ingeniería de imagen y el desarrollo de personajes, permite a los creadores afinar modelos de IA, en este caso, el modelo Amazon Nova Canvas, para gestionar de manera precisa las apariciones y expresiones de los personajes en diferentes escenas.

FuzzyPixel, una división de Amazon Web Services (AWS), ha llevado a cabo un proyecto donde, usando el corto animado Picchu, se preparan datos de entrenamiento mediante la extracción de fotogramas clave. A través del afine del modelo, se logra mantener la coherencia de los personajes principales, Mayu y su madre, facilitando la generación rápida de conceptos de guiones gráficos para futuras secuelas.

El flujo de trabajo automatizado comienza con la carga de un activo de video en un bucket de Amazon Simple Storage Service (S3). Este proceso involucra varias etapas, como la disminución de la resolución de los fotogramas y la selección de aquellos que muestran a los personajes, además de generar subtítulos utilizando el modelo Amazon Nova. Posteriormente, los creadores pueden entrar en un entorno de notebook en Amazon SageMaker AI para iniciar el trabajo de entrenamiento del modelo.

El proceso de extracción de personajes implica tomar fotogramas de video a intervalos fijos, realizando detección de etiquetas y búsqueda de rostros para identificar a los personajes. Esto se complementa con un algoritmo de deduplicación que asegura la diversidad del conjunto de datos al eliminar imágenes visualmente similares que pudieran llevar a un sobreajuste del modelo.

Una vez se recopilan suficientes imágenes etiquetadas, se verifica la calidad de los datos a través de un proceso de human-in-the-loop, asegurando que solo se utilice información precisa para el entrenamiento del modelo. Resultados positivos en las pruebas preliminares sugieren que con los ajustes correctos en los hiperparámetros, se puede lograr una mejora significativa en la consistencia visual.

Una vez afinado, el modelo se encuentra disponible para su despliegue. Este proceso se puede realizar desde la consola de Amazon Bedrock o utilizando el SDK de Python para una integración más personalizada. Los creadores ahora pueden probar el modelo para generar nuevas imágenes, manteniendo la coherencia estilística y de calidad en la narración de sus historias.

Con esta innovadora metodología, se espera no solo acelerar considerablemente la producción de guiones gráficos, sino también elevar la calidad del contenido visual, permitiendo a los equipos creativos concentrarse más en la narrativa y menos en la consistencia técnica.

vía: AWS machine learning blog