Actualités Tech

ARM : Cortex-A78, Cortex-X1 et Mali-G78 pour les SoCs en 2021

ARM: Cortex-A78, Cortex-X1 und Mali-G78 für SoCs in 2021

ARM a introduit de nouvelles IP provenant des domaines CPU, GPU et NPU, avec lesquelles les fournisseurs de SoC entreront dans l’année à venir. Il s’agit notamment de Cortex-A78 (Hercule) et de la variante personnalisée de Cortex-X1 qui en est dérivée avec plus de puissance. Le Mali-G78 et le Mali-G68 sont les nouveaux GPU, tandis que l’Ethos-N78 est le nouveau NPU.

Le Cortex-A78 s’appuie sur le Cortex-A77 et a été optimisé en termes d’efficacité et de surface, mais délivre toujours plus de puissance. Un noyau basé sur le Cortex-A78 devrait fournir une puissance soutenue de 20 % supérieure à celle du Cortex-A77 dans un corset de 1 watt, selon les mesures effectuées par SPECint2006.

5 % de puissance en plus avec le même cycle

Cependant, la GRA inclut également dans le processus d’évaluation comparative les améliorations résultant d’un changement attendu dans le processus de production. L’augmentation de 20 % de la puissance à 1 watt de consommation est le résultat d’améliorations architecturales et d’une vitesse d’horloge 15 % plus élevée, qui est elle-même rendue possible par le passage prévu de 7 nm FinFET à 5 nm FinFET chez les fournisseurs de SoC et leurs fabricants. Le Cortex-A78 aura donc à lui seul environ 5 % de puissance en plus à la même vitesse d’horloge.

Un Cortex-A78 est conçu pour offrir les mêmes performances à 2,1 GHz qu’un Cortex-A77 à 2,3 GHz, en utilisant 50 % d’énergie en moins. Cette comparaison prend également en compte le passage du FinFET 7 nm au FinFET 5 nm. L’ARM a réduit de moitié le nombre de caches L1 et L2, économisant 5 % de la surface au millimètre carré par rapport au Cortex-A77. Cependant, les optimisations architecturales font plus que compenser cette perte.

cortex-A78

cortex-A78

cortex-A78

cortex-A78

Cortex-X1, une variante personnalisée plus puissante

Le Cortex-X1 a été réglé pour une performance maximale par l’ARM et est basé sur le Cortex-A78. C’est le premier résultat du nouveau programme Cortex-X Custom (CXC), qui permet à des partenaires comme Qualcomm ou Samsung de concevoir un noyau selon leurs propres spécifications. Avec le Cortex-X1, ARM propose une conception correspondante comme base, qui fournit 22 % de puissance en plus à 3,0 GHz que le Cortex-A78. Pour ce faire, le Cortex-X1 est équipé de deux fois la taille du cache L1 et L2 et est situé dans un cluster DynamIQ avec 4 Mo de cache L3. Le Cortex-X1 devrait être un noyau principal encore plus rapide, comme celui que Qualcomm utilise dans Snapdragon 865 sous la forme d’un Cortex-A77 plus cadencé avec plus de cache.

cortex-X1

cortex-X1

cortex-X1

cortex-X1

cortex-X1

cortex-X1

cortex-X1

cortex-X1

L’efficacité et la surface se trouvent à l’arrière du Cortex-X1. Un cluster DynamIQ normal basé sur quatre Cortex-A78 et quatre Cortex-A55 nécessite 15 % de surface en moins par rapport aux plus grands noyaux et fournit 20 % de puissance en plus que le même cluster avec quatre Cortex-A77. Cependant, si l’un des Cortex-A78 est échangé contre le Cortex-X1 et que le cache L3 de l’ensemble de la grappe est doublé, passant de 4 Mo à 8 Mo, la surface nécessaire augmente de 15 % par rapport à l’ancienne grappe avec quatre Cortex-A77, mais délivre également 30 % de puissance en plus à la pointe. Il appartient aux partenaires de décider comment un noyau personnalisé basé sur le Cortex-X1 s’intègre au mieux dans leur propre conception de SoC pour maintenir l’équilibre entre performance, efficacité et espace.

Le Mali-G78 a jusqu’à 50 % de semences en plus

Davantage de performances GPU sont disponibles avec le Mali-G78 basé sur l’architecture Valhall du Mali-G77. Maintenant, avec 24 unités de calcul au lieu de 16 au maximum, des unités graphiques plus grandes et plus puissantes peuvent être intégrées dans un SoC. Avec « Asynchronous Top Level », ARM divise le GPU en différents domaines d’horloge et de tension pour le top level avec les caches, le scheduler et le tiler ainsi que les shaders. Dans les benchmarks et les jeux, une version à 18 cœurs du G78 du Mali devrait être 8 à 14 % plus rapide, une version à 24 cœurs 9 à 15 % plus rapide. Dans le diagramme à barres de la deuxième diapositive, l’augmentation des performances mentionnée par ARM se réfère exclusivement au Mali-G78 MP18. Le segment inférieur sert l’ARM du Mali-G68, plus petit, qui a la même architecture Valhall que les améliorations du Mali-G78, mais est limité à six groupes de shaders.

Mali-G78

Mali-G78

Mali-G78

Mali-G78

Mali-G78

Mali-G78

Mali-G78

Mali-G78

Ethos-N78 délivre jusqu’à deux fois plus de puissance ML

L’Ethos N78 est lancé en tant que nouvelle NPU (Neural Processing Unit), notamment pour l’apprentissage machine. Bien que ces tâches puissent également être effectuées sur l’unité centrale, la NPU offre plus de puissance et d’efficacité. Les partenaires peuvent concevoir la puissance de calcul requise, la SRAM et les moteurs vectoriels en fonction de leurs propres besoins, ce qui permet d’atteindre des niveaux de performance de 1 à 10 TeraOPS. Plus de 90 configurations des variables ci-dessus sont possibles, explique ARM. Au sommet, les performances augmentent ainsi de 100 % par rapport aux 5 TeraOPS de l’Ethos N77.

Ethos-N78

Ethos-N78

Ethos-N78

Ethos-N78

Partager cet article
Robin Vigneron

About author
Robin est un passionné de nouvelles technologies et il n'hésites pas à creuser le web pour vous trouver les meilleurs bons plans et astuce High-Tech !
Articles