Dans le cadre du Intel Vision 2022, Intel a dévoilé le processeur d’entraînement d’intelligence artificielle (IA) Gaudi2 fraîchement sorti de Habana Labs, la société israélienne de puces accélératrices d’IA acquise en 2019.
La puce est spécialement conçue pour les applications d’apprentissage en profondeur de l’IA. Elle utilise le processus de fabrication 7 nm d’Intel, un bond significatif par rapport au processus 16 nm utilisé pour la première génération. La puce Gaudi2 comprend 24 cœurs de traitement Tensor, trois fois plus que le premier Gaudi, pour des charges de travail d’apprentissage en profondeur plus importantes. De plus, Gaudi2 intègre le traitement multimédia sur puce, dispose de 96 Go de mémoire à large bande passante (HBM2E) et de 48 Mo de RAM statique (SRAM). Intel affirme que ces améliorations triplent les performances par rapport à la première génération.
Gaudi2 est également livré avec 24 ports 100 Gigabit RDMA over Converged Ethernet (RoCE) pour augmenter la bande passante d’entraînement de Gaudi2. En utilisant Ethernet au lieu d’un connecteur propriétaire, le processeur accepte une large gamme d’équipements réseau Ethernet, permettant aux clients de faire évoluer facilement leurs clusters sans coûts élevés.
Intel affirme également que Gaudi2 est en tête face à ses concurrents. La société a soutenu cette affirmation en le comparant au GPU A100-80GB de Nvidia dans une confrontation ResNet50 et BERT. ResNet50 est un réseau neuronal couramment utilisé pour la reconnaissance d’images, tandis que BERT est un modèle de réseau neuronal utilisé pour le traitement du langage naturel. Les deux représentent des cas d’utilisation courants dans les applications d’IA modernes. Dans ses scénarios, Intel affirme que Gaudi2 offre 1,9 fois le débit de l’A100-80 Go en ResNet 50 et est deux fois plus rapide en BERT. De plus, Gaudi2 a à peu près la même taille de matrice que l’A100, a noté le directeur de l’exploitation de Habana Labs, Eitan Medina, dans le communiqué de presse.
Arctic Sound – M
En plus du Gaudi2, Intel a également parlé d’un GPU pour les centres de données multimédias nommé Arctic Sound – M. Chaque carte Arctic Sound – M comprend jusqu’à quatre moteurs multimédias Xe, jusqu’à 32 unités de ray-tracing et cœurs Xe, une accélération matérielle pour le codec AV1 et dispose d’une accélération XMX AI intégrée. Intel a déclaré qu’une seule carte peut prendre en charge plus de 30 flux vidéo 1080p ou plus de 40 flux de jeu pour les jeux en nuage. Il prend également en charge jusqu’à 62 fonctions virtualisées pour les infrastructures de bureau virtuel.
Arctic Sound – M sera disponible sur les cartes PCIe de quatrième génération au troisième trimestre de 2022.
Lire aussi :
Nouveau laboratoire d’intelligence artificielle à Montréal
Projet pilote d’IA soutenant la demande en électricité des véhicules à Ottawa
Québec lance un appel de projets en matière d’intelligence artificielle
Traduction et adaptation française par Renaud Larue-Langlois