Un reciente avance en la creación de guiones gráficos animados emplea la inteligencia artificial para lograr una coherencia visual sin precedentes entre personajes. Esta innovadora técnica, basada en la ingeniería de imagen y el desarrollo de personajes, permite a los creadores afinar modelos de IA, como el modelo Amazon Nova Canvas, para manejar de manera precisa las apariciones y expresiones de los personajes a lo largo de diferentes escenas.
FuzzyPixel, una subdivisión de Amazon Web Services (AWS), ha desarrollado un proyecto pionero utilizando el corto animado Picchu, mediante el cual preparan datos de entrenamiento extrayendo fotogramas clave. A través del ajuste del modelo, se consigue mantener la consistencia en los personajes principales, Mayu y su madre, lo que facilita la rápida generación de conceptos para futuras secuelas.
El proceso automatizado comienza con la carga de un recurso de video en un bucket de Amazon Simple Storage Service (S3). Este flujo de trabajo incluye etapas como la reducción de la resolución de los fotogramas, la selección de aquellos que muestran a los personajes principales y la generación de subtítulos a través del modelo Amazon Nova. Posteriormente, los creadores pueden utilizar un entorno de notebook en Amazon SageMaker AI para iniciar el entrenamiento del modelo.
La extracción de personajes implica tomar fotogramas de video a intervalos regulares, realizar detección de etiquetas y búsqueda de rostros para identificar a los personajes. Un algoritmo de deduplicación asegura la diversidad del conjunto de datos al eliminar imágenes similares que podrían llevar a un sobreajuste del modelo.
Una vez recopiladas suficientes imágenes etiquetadas, se verifica la calidad de los datos mediante un proceso de revisión humana, garantizando que solo se utilice información precisa durante el entrenamiento. Los resultados preliminares apuntan a que, con ajustes correctos en los hiperparámetros, se puede mejorar significativamente la consistencia visual.
El modelo finalmente afinado está listo para su despliegue. Este proceso puede realizarse desde la consola de Amazon Bedrock o integrarse de manera personalizada utilizando el SDK de Python. Los creadores ahora pueden evaluar el modelo generando nuevas imágenes que mantienen la coherencia estilística y de calidad en la narrativa de sus historias.
Con esta metodología revolucionaria, no solo se espera acelerar la producción de guiones gráficos, sino también incrementar la calidad del contenido visual, permitiendo a los equipos creativos centrarse más en la narrativa y menos en la consistencia técnica.