En un sorprendente avance, un equipo de ingenieros ha logrado desarrollar un clúster Ceph capaz de sostener un rendimiento de lectura secuencial de 1 TiB/s, superando todos los registros previos en el campo del almacenamiento distribuido. Este logro es el resultado de meses de trabajo exhaustivo, combinando hardware de última generación con una red optimizada para alto rendimiento.
La transformación comenzó en 2023 cuando una destacada empresa decidió actualizar su clúster existente a una configuración totalmente NVMe de 10 PB. En colaboración con Clyso, adoptaron una arquitectura que cuenta con 68 servidores Dell PowerEdge R6615, equipados con procesadores AMD EPYC 9454P, 192 GiB de RAM DDR5, dos interfaces Mellanox de 100 GbE por nodo y NVMe Enterprise.
El despliegue incluyó la versión Ceph Quincy v17.2.7 sobre Ubuntu 20.04.6, logrando un total de 630 OSDs activos, distribuidos en 17 racks. Los ingenieros enfrentaron diversos desafíos, desde problemas de latencia hasta contención de recursos en el kernel, los cuales fueron resueltos mediante ajustes precisos en el sistema.
A lo largo del proceso, se identificaron y superaron varios cuellos de botella críticos. La desactivación de los estados de inactividad del CPU, la eliminación de restricciones en IOMMU, y una correcta compilación de componentes claves como RocksDB fueron algunas de las soluciones que permitieron alcanzar el rendimiento deseado.
El resultado final fue impresionante: el clúster alcanzó 1,025 TiB/s en lectura secuencial con 3 réplicas y sorprendentes cifras en otras métricas de rendimiento, como 270 GiB/s en escritura secuencial y 25.5 millones de IOPS en lectura aleatoria 4K.
Este despliegue no solo establece un nuevo estándar en rendimiento, sino que también demuestra la capacidad de Ceph para competir con soluciones propietarias de almacenamiento. A pesar de ser un logro técnico, las aplicaciones empresariales de esta tecnología se encuentran a la vuelta de la esquina.
David Carrero de Stackscale enfatiza la relevancia de Ceph en entornos empresariales, subrayando que aunque no todas las empresas requieren un rendimiento tan extremo, la flexibilidad y escalabilidad de Ceph son activos invaluables para cualquier organización.
Este avance reafirma que Ceph es una solución viable y robusta para el almacenamiento distribuido, ofreciendo a las empresas la oportunidad de controlar sus datos de manera eficiente y rentable.
Más información y referencias en Noticias Cloud.