AMD Instinct MI300C: Mukautettu Epyc-prosessori 128 Gt HBM3:lla Microsoft 40 -kommentteja varten
Kuva: AMD
SC24/Ignite-tapahtumassa Microsoft Azure julkaisi ensimmäisen Zen 4 -prosessorin HBM3:lla nimellä Epyc. Tämän takana on tuote, joka tunnettiin viimeksi nimellä Instinct MI300C: AMD mainitsi tämän muunnelman tulevaisuuden vaihtoehtona jo vuonna 2023. Toistaiseksi räätälöity 4. sukupolven Epyc-prosessori on melko eksklusiivinen.
Sunnuntaina, kun AMD:n datakeskusdivisioonan johtaja oli läsnä nopeimman uuden supertietokoneen, El Capitanin, esittelyssä, AMD mainitsi lyhyesti MI300C:n mahdollisena vaihtoehtona. Hän ei luultavasti halunnut eikä saanut paljastaa, että se oli virallista ennen kuin kaksi päivää myöhemmin ja sanoi yksinkertaisesti ”saatat kuulla siitä jotain myöhemmin” – joten ilmoitus tulevasta sulkemisesta mainittiin jo siellä.
Mikä on Instinct MI300C?
MI300 (MI300X & MI300A (Tiedot)) on kiihdytin korkean suorituskyvyn laskentaympäristöön ja erityisesti tällä hetkellä kukoistavaan tekoälysektoriin. Tämä ei sisällä vain mukautuksia jo tunnettuihin arkkitehtuureihin (CDNA); Kaikki on myös pakattu ns. 3.5D-pakettiin. Tätä varten AMD käyttää hyvin tunnettua 2.5D-sirusuunnittelua, joka on ollut saatavilla vuosia grafiikkasirujen muodossa ja HBM:n vieressä, mutta se ei vain mene kirjaimellisesti vielä pidemmälle ylimääräisen 3D-pinoamisen avulla, jotta tuote lepää 3.5D-pinolla.
AMD Instinct MI300 -perheen arkkitehtuuri (Kuva: AMD)
Pohjalevy, jos haluat ilmaista sen näin, on I/O-matriisi. Niistä neljä on vierekkäin. Joko todellinen GPU/XCD kuolee tai CPU-sirut on asennettu niihin. MI300A:ssa on kuusi XCD:tä ja kolme CCD:tä.
AMD Instinct MI300 -perheen arkkitehtuuri (Kuva: AMD)
Korvaa GPU CPU-piirisarjoilla
MI300C:ssä XCD:t (GPU-yksiköt) vaihdetaan nyt ylimääräisiin CCD-lohkoihin, koska MI300A:ssa on vain kolme, joista jokaisessa on kahdeksan ydintä. 24 Zen 4 -ytimestä tulee yhteensä 96 ydintä. Loput pysyvät lähes ennallaan. Tämä sisältää myös pakkauksessa olevan 128 Gt:n HBM3-muistin. MI300C on pohjimmiltaan Epyc-prosessori, jossa on HBM3.
Käytännössä itse asiassa 88 ytimellä ja ilman SMT:tä
Käytännössä teoriasta tulee kuitenkin helposti erilaisia parametreja käyttötarkoituksen mukaan. Azure HBv5 -virtuaalikoneessa Microsoft käyttää neljää näistä ratkaisuista kvartetissa. Kuitenkin vain 88 ydintä on saatavilla prosessoria kohden; kahdeksan ydintä kukin huolehtii käyttöjärjestelmästä ja hallinnasta, jotta kaikki toimii sujuvasti. Yhdellä kortilla on neljä näitä prosessoreita, joiden kellotaajuus on enintään 4 GHz, eli yhteensä 352 ydintä.
HBv5-virtuaalikone (Kuva: Azure)
Se, poistettiinko myös SMT, riippuu VM-alueen aiotusta käytöstä, mutta myös suurimmasta mahdollisesta muistin kaistanleveystavoitteesta. Lähes 7 TB sekunnissa on harvinaista markkinoilla. Nämä toteutetaan käyttämällä maksimissaan 400–450 Gt HBM3:a, kirjoittaa Azure, ja ne jäävät jälleen teoreettisen maksimimäärän 512 Gt alapuolelle.
Tekniset perustiedot sisältävät:
6,9 TB/s muistin kaistanleveys (STREAM Triad) 400–450 Gt RAM-muistilla (HBM3) Jopa 9 Gt muistia ydintä kohden (asiakkaan konfiguroitavissa) Jopa 352 AMD EPYC ”Zen4″ -prosessoriydintä”, 4 GHz:n huipputaajuudet (asiakkaan konfiguroitavissa) Infinity Fabric 2X kokonaiskaistanleveys prosessorien välillä verrattuna mihin tahansa alustaan tähänastisista AMD EPYC™ -palvelimista. SMT pois käytöstä, vain yhden vuokraajan suunnittelu (1 VM per palvelin) 800 Gbps NVIDIA Quantum-2 InfiniBand, tasapainotettu 200 Gbps:iin SoCAAzure VMSS Flex -prosessoria kohden MPI-työkuormituksen skaalaamiseksi satoihin tuhansiin prosessoriytimiin, jotka toimivat HBM160 Gbps:n Azure-verkon tehonlähteenä 2. sukupolven Azure Boost NIC14 TB paikallisen NVMe SSD -toimituksen kautta Jopa 50 Gt/s luku- ja 30 Gt/s kirjoituskaistanleveys
SC24-näyttelyssä Atlantassa ilmoitettiin, että nämä AMD-prosessorit eivät olisi saatavilla yleisratkaisuna; toistaiseksi ne pysyvät Azuren yksinomaisina.
Aiheet: AMD AMD Genoa Epyc HBM Instinct Prosessorit SC24 Palvelin Supertietokone Economy Zen Lähde: Microsoft

Marc analysoi prosessoreita testaamalla niiden suorituskykyä pelaamiseen, sisällöntuotantoon ja tekoälyyn.