AMD Instinct MI300C: Un procesador Epyc personalizado con 128 GB HBM3 para Microsoft

AMD Instinct MI300C: Un procesador Epyc personalizado con 128 GB HBM3 para Microsoft 40 comentarios

AMD Instinct MI300C: Un procesador Epyc personalizado con 128 GB HBM3 para Microsoft

Imagen: AMD

En SC24/Ignite, Microsoft Azure lanzó el primer procesador 4 con HBM3 bajo el nombre de Epyc. Detrás de esto está el producto conocido más recientemente como Instinct MI300C: AMD ya había mencionado esta variante como una opción futura en 2023. Por ahora, el procesador Epyc personalizado de cuarta generación sigue siendo bastante exclusivo.

El domingo, cuando el jefe de la división de centros de datos de AMD estuvo presente en la presentación del nuevo superordenador más rápido, El Capitán, AMD mencionó brevemente el MI300C como una posible opción. Probablemente no quiso y no se le permitió revelar que era oficial hasta dos días después y simplemente dijo “quizás oigas algo al respecto más tarde”, por lo que un anuncio en el futuro cercano ya se mencionó allí.

¿Qué es el instinto MI300C?

MI300 (MI300X y MI300A (Detalles)) es un acelerador para el entorno informático de alto rendimiento y, en particular, para el sector de la inteligencia artificial (IA), actualmente en auge. Esto no implica sólo adaptaciones a arquitecturas ya conocidas (CDNA); Además, todo está empaquetado en el llamado paquete 3.5D. AMD utiliza para ello el conocido diseño de chip 2,5D, disponible desde hace años en forma de chips gráficos con HBM justo al lado, pero no sólo va literalmente más allá con el apilamiento 3D adicional, de modo que el acabado El producto descansa sobre una pila 3,5D.

Arquitectura de la familia AMD Instinct MI300 Arquitectura de la familia AMD Instinct MI300 (Imagen: AMD)

La placa base, si así lo quieres decir, es la matriz de E/S. Cuatro de ellos están uno al lado del otro. O la GPU/XCD real muere o los chips de la CPU están instalados en ellos. En un MI300A hay seis XCD y tres CCD.

Arquitectura de la familia AMD Instinct MI300 Arquitectura de la familia AMD Instinct MI300 (Imagen: AMD)

Reemplace la GPU con conjuntos de chips de CPU

En el MI300C, los XCD (unidades GPU) ahora se cambian por bloques CCD adicionales, porque en el MI300A sólo hay tres con ocho núcleos cada uno. 24 núcleos Zen 4 se convierten en un total de 96 núcleos. El resto sigue casi igual. Esto también incluye la memoria HBM3 de 128 GB incluida en el paquete. El MI300C es esencialmente un procesador Epyc con HBM3.

En la práctica con 88 núcleos y sin SMT

En la práctica, sin embargo, la teoría se convierte fácilmente en parámetros diferentes según el uso previsto. En la máquina virtual Azure HBv5, Microsoft utiliza cuatro de estas soluciones en un cuarteto. Sin embargo, sólo hay 88 núcleos disponibles por CPU; Cada uno de ocho núcleos se encarga del sistema operativo y la administración para que todo funcione sin problemas. Hay cuatro de estos en una sola placa, con una frecuencia máxima de 4 GHz, lo que hace un total de 352 núcleos.

máquina virtual hbv5 Máquina virtual HBv5 (Imagen: Azure)

Si SMT también se deshabilitó depende del uso previsto en el área de VM, pero también del objetivo de ancho de banda de memoria máximo posible. Casi 7 TB por segundo son poco comunes en el mercado. Estos se implementan utilizando un máximo de 400 a 450 GB de HBM3, escribe Azure, y nuevamente se mantienen por debajo del máximo teórico de 512 GB.

Los datos técnicos básicos incluyen:

Ancho de banda de memoria de 6,9 ​​TB/s (STREAM Triad) en 400 a 450 GB de RAM (HBM3) Hasta 9 GB de memoria por núcleo (configurable por el cliente) Hasta 352 núcleos de procesador AMD EPYC “Zen4”, frecuencias máximas de 4 GHz (configurables por el cliente) Infinity Fabric duplica el ancho de banda total en todos los procesadores frente a cualquier plataforma de servidores AMD EPYC™ hasta la fecha. SMT deshabilitado, solo diseño de inquilino único (1 VM por ) NVIDIA Quantum-2 InfiniBand de 800 Gbps, equilibrado a 200 Gbps por SoCA Procesador Azure VMSS Flex para escalar cargas de trabajo MPI a cientos de miles de núcleos de CPU con tecnología HBM de 160 Gbps de red acelerada de Azure a través de una local de 2.ª generación Azure Boost NIC de 14 TB que ofrece hasta 50 GB/s de ancho de banda de lectura y 30 GB/s de escritura

En la feria SC24 de Atlanta se anunció que estos procesadores AMD no estarían disponibles como solución general; Por ahora, seguirán siendo exclusivos de Azure.

Temas: AMD AMD Genoa Epyc HBM Instinct Procesadores SC24 Servidor Supercomputadora Economía Zen Fuente: Microsoft

Deja un comentario

Your email address will not be published. Required fields are marked *

Scroll al inicio