Cloudera ha dado un paso significativo en su misión de consolidar un «lakehouse» abierto, basado en Apache Iceberg, durante su evento EVOLVE25 en Nueva York. La empresa ha lanzado dos innovaciones que ya están disponibles para los usuarios: el Cloudera Iceberg REST Catalog, que promete compartir datos sin necesidad de copias adicionales y con metadatos unificados, y el Cloudera Lakehouse Optimizer, un servicio que garantiza la optimización automática y el mantenimiento inteligente de tablas Iceberg.
Estas herramientas pretenden resolver los problemas de complejidad arquitectónica, silos de datos y gobernanza inconsistente que enfrentan las empresas al implementar inteligencia artificial (IA) donde tienen sus datos. Con el catálogo REST, Cloudera quiere proporcionar un acceso abierto y seguro a los datos, mientras que el Optimizer mejorará significativamente el rendimiento de las consultas, acelerándolas hasta 13 veces y reduciendo el almacenamiento en un 36 por ciento.
La importancia de estas innovaciones radica en la capacidad de entrenar y analizar IA en cualquier nube sin mover los datos, lo cual podría reducir significativamente los costos y riesgos asociados al manejo de grandes volúmenes de información. El catálogo REST de Iceberg facilita la interoperabilidad con motores de terceros como Snowflake, Databricks y AWS, asegurando la consistencia en las políticas de acceso y gobernanza de datos.
Además, el Lakehouse Optimizer promete eliminar la fricción en la gestión de tablas Iceberg mediante prácticas como la reescritura inteligente de archivos y el mantenimiento proactivo, reemplazando procesos manuales y propensos a errores por automatización eficiente.
Como pioneros en esta tecnología, Cloudera busca ser uno de los primeros en ofrecer el Iceberg REST Catalog en una plataforma completa de datos e IA, abarcando desde la ingesta en tiempo real hasta el consumo en BI e IA. Según la empresa, esta integración no solo mejorará el tiempo de obtención de valor (time-to-value) para sus clientes, sino que también reducirá significativamente el costo total de propiedad (TCO) gracias a la reducción de almacenamiento y mejora en la visibilidad de datos.
De cara al futuro, Cloudera planea seguir impulsando la adopción de Apache Iceberg como el estándar para «lakehouses» abiertos, ofreciendo un enfoque que combina flexibilidad, escalabilidad e insights sin concesiones. La promesa es clara: llevar la IA a los datos en cualquier entorno, desde nubes públicas hasta centros de datos y edge, manteniendo un gobierno unificado y sin encerrar a los clientes en sistemas propietarios.
La disponibilidad de estas capacidades en diversas plataformas, incluida una versión futura on-premises del Optimizer, representa una ventaja para sectores regulados o con requisitos de soberanía. Con este enfoque, Cloudera reafirma su compromiso de proporcionar un «lakehouse» realmente abierto, que evite el lock-in y permita a las empresas futuro-probar sus estrategias de datos.
Más información y referencias en Noticias Cloud.