Supercomputadora El Capitan: el buque insignia de AMD hunde Intel Aurora con 44.544 APU MI300A

Supercomputadora El Capitan: el buque insignia de hunde Intel Aurora con 44.544 APU MI300A

Supercomputadora El Capitan: el buque insignia de AMD hunde Intel Aurora con 44.544 APU MI300A

Imagen: HPE

El superordenador El Capitan equipado con AMD Instinct MI300A ofrece un 72% más de rendimiento que el Aurora de Intel, pero consume 9 MW menos. El resultado es un sistema que es más del doble de eficiente (GFLOP/vatio), producido por un total de 11.039.616 “núcleos”, de los cuales sólo alrededor de un millón son núcleos de CPU.

Tabla de contenido El buque insignia de AMD supera a Intel Aurora con 44,544 APU MI300A Listo para usar 1er lugar El Capitán tiene tres ramas Computa juegos como millones No solo rápido, sino también eficiente Ahora estamos optimizando aún más

1er lugar inmediatamente

De principio a fin, vuelve a ser un éxito magistral el que han conseguido los socios de este proyecto. Y casi como se esperaba, como bromearon los implicados durante la rueda de prensa del domingo. En última instancia, los mayores obstáculos fueron las aprobaciones, no el hardware. Al final, todos están visiblemente orgullosos, incluida la directora ejecutiva de AMD, Lisa Su.

Los gabinetes HPE equipados con la ya ampliamente utilizada solución de red de supercomputadores HPE Slingshot (versión 11) fueron los primeros en entregarse hace unos meses, lo que significa que toda la red pudo configurarse antes de la instalación de los primeros nodos informáticos (servidores equipados con potencia informática). ). . fueron entregados. HPE también está en racha últimamente: los tres principales superordenadores son producidos por este fabricante en una configuración muy similar.

El Capitán para el Top500 revelado en noviembre de 2024 El Capitán para la presentación del Top500 en noviembre de 2024 (Imagen: HPE)

El Capitán tiene tres sucursales.

Sin embargo, El Capitán es único. Pero único no significa completamente solo, porque los puestos 10, 20 y 49 del nuevo superordenador Top500 de noviembre de 2024 son, por así decirlo, pequeñas ramificaciones del gran sistema con el mismo hardware, pero a menor escala.

Place 10 Tuolumne, por ejemplo, es un sistema abierto que también se utilizará para la gratuita, mientras que El Capitán desaparecerá a puerta cerrada dentro de unos meses para dedicarse por completo a la disuasión nuclear estadounidense. El sistema fue construido específicamente y alojado en el Laboratorio Nacional Lawrence Livermore (LLNL) bajo la dirección de la Administración Nacional de Seguridad Nuclear (NNSA).

Juegos de matemáticas al estilo del millón de dólares

Actualmente hay 11,136 nodos en uso, con un total de 44,544 APU AMD Instinct serie MI300A (detalles) instaladas: cuatro APU por nodo. La velocidad de reloj de los núcleos del procesador es comparativamente muy baja, de 1,8 GHz.

Del total de 11.039.616 núcleos clasificados en la lista Top500, 9.988.224 son GPU. Según las 228 CU CDNA3 por APU especificadas por AMD, esto da como resultado 43,808 APU activas en el sistema, que ofrecen 1,051,392 núcleos de CPU, lo que matemáticamente coincide exactamente con los núcleos de GPU y el número total enumerado. En total, el sistema también tiene más de 5,4 petabytes de memoria principal. Como sabemos, una APU ofrece 128 GB de HBM3, por cada blade de doble nodo son 1.024 GB; este también es el caso de 43.808 APU activas.

Detalles completos sobre AMD Instinct MI300A y MI300XAMD MI300A y MI300X: La nueva serie Instinct es un hito en muchas áreas.

En definitiva, El Capitan tiene 1.742 ExaFLOP (Rmax) de 2.746 ExaFLOPS posibles, que se define como el valor máximo (Rpeak). Esto ya representa el 63 por ciento de la potencia máxima, a la que de todos modos es difícilmente accesible. El antiguo Frontier número 1, también equipado con hardware AMD, ha alcanzado el 66% de su valor máximo, ahora hay 1.353 ExaFLOP (a principios de 2022 era 1,1 ExaFLOPS).

Solo en términos de especificaciones, Frontier ahora se ubica en alrededor del 70% de su pico calculado, El Capitán en alrededor del 62% cuando debutó. Esto los coloca a ambos muy por delante del número 3, Aurora de Intel. Esto siempre equivale a 1,012 ExaFLOP, el valor máximo es 1,98 ExaFLOP. La brecha entre el rendimiento máximo y el rendimiento prácticamente utilizable sigue siendo significativamente mayor en Intel. Hasta la fecha, el plan original de Intel de ofrecer nuevamente la supercomputadora más rápida del mundo ha sido abandonado por completo.

El Capitán para el Top500 revelado en noviembre de 2024 El Capitán para la presentación del Top500 en noviembre de 2024 (Imagen: HPE)

No sólo rápido, sino también eficiente

La eficiencia de los sistemas AMD no queda de lado, sino todo lo contrario. El sistema también destaca con un consumo de energía relativamente “bajo” de 29,58 megavatios. Esto significa que el sistema consume 5 MW más que Frontier, pero también es ligeramente más eficiente, por lo que al final el valor de eficiencia GFLOP/Watt es 58,89 para El Capitan y 54,98 para Frontier. Ambos están muy bien posicionados, pero no se acercan a igualar la eficiencia de los sistemas Instinct más pequeños y las soluciones Grace Hopper más allá de la marca 60. Los dos mejores sistemas AMD son más del doble de eficientes que Intel Aurora. Esto consume 38,69 megavatios para aproximadamente un ExaFLOP y, por tanto, sólo alcanza un valor de eficiencia de 26,15. El operador explica que El Capitán acabó ocupando un puesto bastante alto en relación precio/rendimiento, a pesar de un precio de tres dígitos.

LLNL también planea seguir utilizando supercomputadoras de primer nivel en el futuro. El próximo sistema probablemente será una solución a exaescala; hablar directamente sobre escala zetta no es útil y probablemente todavía esté demasiado lejos. Pero también se están considerando sistemas más pequeños; Para muchas , estos son sencillamente más adecuados que un enorme superordenador.

Ahora seguimos optimizando

El Capitan se optimizará aún más en las próximas semanas y meses, y probablemente también habrá un punto de referencia de Linpack que también podría incluirse en la clasificación Top500. Esto podría dar lugar a un rendimiento aún mayor, tras lo cual el sistema quedaría tras puertas cerradas y cumpliría sus tareas de seguridad nacional.

Techconseil recibió información sobre este artículo de HPE y Top500 bajo NDA. El único requisito era la fecha de publicación más temprana posible.

Temas: Tarjetas gráficas AMD HPE Instinct Supercomputadoras Economía

Deja un comentario

Your email address will not be published. Required fields are marked *

Scroll al inicio