Monks, la aclamada marca operativa digital de S4Capital plc, ha dado un paso trascendental en el ámbito global de la innovación tecnológica y los servicios de marketing. La compañía ha presentado un proyecto revolucionario que cuadruplica la velocidad de generación de imágenes en tiempo real, utilizando los más recientes avances en Amazon Web Services (AWS) y aceleración de aprendizaje automático.
El desafío inicial para Monks era mejorar la generación de imágenes en tiempo real, superando obstáculos significativos relacionados con la escalabilidad y los costos. Los métodos tradicionales resultaban costosos y no cumplían con los estrictos requisitos de baja latencia. Ante esto, Monks decidió explorar soluciones avanzadas de AWS en busca de una computación altamente eficiente y escalable.
La solución consistió en adoptar los chips AWS Inferentia2 combinados con puntos de inferencia asíncronos de Amazon SageMaker. Estas tecnologías no solo prometieron una mejora cuádruple en la velocidad de procesamiento, sino también una significativa reducción de costos gracias a un escalado automático y gestionado.
El proyecto comenzó con la afinación del modelo Stable Diffusion XL, utilizando imágenes específicas del dominio almacenadas en Amazon S3 mediante Amazon SageMaker JumpStart. Con el modelo afinado, Monks implementó un punto de inferencia asíncrono utilizando los chips AWS Inferentia2. Esto permitió gestionar solicitudes de gran carga y tiempos prolongados de procesamiento sin comprometer los requisitos de latencia.
El flujo de trabajo incluía la creación de puntos de inferencia, el manejo de solicitudes, el procesamiento y almacenamiento de resultados en Amazon S3 y la notificación de finalización mediante Amazon SNS. La capacidad de escalar automáticamente las instancias según la demanda y reducir el número de instancias a cero durante periodos de inactividad fue crucial para la eficiencia de costos.
La implementación de puntos de inferencia asíncronos de SageMaker permitió gestionar eficazmente cargas variables de tráfico, optimizando el uso de recursos. Monks alcanzó la asombrosa capacidad de procesar un promedio de 27,796 imágenes por hora por instancia, logrando una mejora sustancial en el rendimiento y una reducción del 60% en los costos por imagen.
Un factor clave en esta optimización fue el uso de políticas de escalado personalizadas con métricas de Amazon CloudWatch. Las métricas personalizadas permitieron a Monks ajustar en tiempo real la capacidad de computación necesaria, optimizando tanto el rendimiento como los costos. Estas métricas incluyeron capacidades de inferencia, número de solicitudes y tasas de utilización.
El despliegue de los chips AWS Inferentia2 no solo mejoró el rendimiento de la inferencia, sino que también incrementó la eficiencia y redujo los costos. El modelo optimizado era capaz de entregar imágenes en tan solo 9.7 segundos, cumpliendo con los exigentes requisitos de latencia de la campaña.
En resumen, la implementación de estos puntos de inferencia asíncronos de SageMaker con chips AWS Inferentia2 permitió a Monks manejar eficientemente distintas cargas de tráfico, reducir costos y mejorar significativamente el rendimiento. Este avance proporciona una guía efectiva para otras aplicaciones de inteligencia artificial generativa, demostrando que la combinación de estas tecnologías es una solución robusta y económica para tareas computacionales intensivas. Monks sigue consolidándose como un socio digital integral, potenciando a las empresas con una producción de contenido más eficiente, experiencias escalables y conocimientos impulsados por inteligencia artificial.