En la era de la globalización, el doblaje de video y la localización de contenidos se erigen como pilares fundamentales para eliminar barreras lingüísticas y expandir el alcance de mercado. No obstante, los métodos tradicionales para doblar videos resultan ser costosos y extensos en cuanto a tiempo, con un costo aproximado de $20 por minuto de revisión humana. Ante este contexto, avances tecnológicos emergen como salvavidas, ofreciendo soluciones más accesibles y eficientes mediante la inteligencia artificial generativa.
Un ejemplo notable de estos avances es la solución de doblaje automático desarrollado por Mission Cloud, en colaboración con la plataforma líder de transmisión de documentales, MagellanTV. Buscando ampliar su presencia global, MagellanTV optó por esta innovadora tecnología para superar los desafíos y costos del doblaje manual.
El proceso comienza con la especificación de entradas en una plantilla de Excel y la carga de estos datos en un bucket de Amazon S3. A partir de ahí, se despliega una serie de servicios de Amazon Web Services (AWS) que trabajan en armonía. Amazon Translate se encarga de la traducción inicial de los subtítulos del video, ofreciendo traducciones rápidas y de alta calidad. Con soporte para más de 75 idiomas y la posibilidad de agregar glosarios personalizados, este servicio se presenta como una solución robusta para la traducción automática.
Posteriormente, Amazon Bedrock entra en juego para la post-edición de estos subtítulos, mejorando la calidad y adaptándose al contexto informal o científico del contenido, según sea necesario. Con su capacidad de detección y reemplazo de modismos y su algoritmo de acortamiento de oraciones, Amazon Bedrock reduce considerablemente el esfuerzo de revisión humana, resultando en un notable ahorro de costos y tiempo.
La sincronización de audio y video se maneja mediante el escalado de tiempo automático habilitado por Amazon Bedrock. Además, Amazon Augmented AI es utilizado para que editores humanos revisen el contenido, asegurando la precisión antes de enviarlo a Amazon Polly, que genera voces sintéticas para el video. Un componente adicional desarrollado es un modelo que predice la expresión de género del hablante, asignando la voz adecuada para mantener la coherencia con el orador original.
En el backend, toda esta operación está orquestada por AWS Step Functions, que maneja cada paso en AWS Lambda o AWS Batch, garantizando una integración fluida y eficiente. Gracias a la herramienta de infraestructura como código (IaC) AWS CloudFormation, la pipeline se torna reutilizable, facilitando el doblaje en múltiples idiomas.
Esta innovadora solución de Mission Cloud ha representado un avance revolucionario para MagellanTV, enfrentándose con éxito a desafíos comunes en la industria de medios y entretenimiento. La integración de inteligencia artificial generativa no solo reduce costos, sino que también abre nuevas oportunidades para la distribución global de contenido, llevando la internacionalización de contenidos a un nivel sin precedentes.