Intel Vision 2022 : le processeur Habana Gaudi2 concurrence le Nvidia A100

Image : Getty

Dans le cadre du Intel Vision 2022, Intel a dévoilé le processeur d’entraînement d’intelligence artificielle (IA) Gaudi2 fraîchement sorti de Habana Labs, la société israélienne de puces accélératrices d’IA acquise en 2019.

La puce est spécialement conçue pour les applications d’apprentissage en profondeur de l’IA. Elle utilise le processus de fabrication 7 nm d’Intel, un bond significatif par rapport au processus 16 nm utilisé pour la première génération. La puce Gaudi2 comprend 24 cœurs de traitement Tensor, trois fois plus que le premier Gaudi, pour des charges de travail d’apprentissage en profondeur plus importantes. De plus, Gaudi2 intègre le traitement multimédia sur puce, dispose de 96 Go de mémoire à large bande passante (HBM2E) et de 48 Mo de RAM statique (SRAM). Intel affirme que ces améliorations triplent les performances par rapport à la première génération.

Gaudi2 est également livré avec 24 ports 100 Gigabit RDMA over Converged Ethernet (RoCE) pour augmenter la bande passante d’entraînement de Gaudi2. En utilisant Ethernet au lieu d’un connecteur propriétaire, le processeur accepte une large gamme d’équipements réseau Ethernet, permettant aux clients de faire évoluer facilement leurs clusters sans coûts élevés.

Intel affirme également que Gaudi2 est en tête face à ses concurrents. La société a soutenu cette affirmation en le comparant au GPU A100-80GB de Nvidia dans une confrontation ResNet50 et BERT. ResNet50 est un réseau neuronal couramment utilisé pour la reconnaissance d’images, tandis que BERT est un modèle de réseau neuronal utilisé pour le traitement du langage naturel. Les deux représentent des cas d’utilisation courants dans les applications d’IA modernes. Dans ses scénarios, Intel affirme que Gaudi2 offre 1,9 fois le débit de l’A100-80 Go en ResNet 50 et est deux fois plus rapide en BERT. De plus, Gaudi2 a à peu près la même taille de matrice que l’A100, a noté le directeur de l’exploitation de Habana Labs, Eitan Medina, dans le communiqué de presse.

Arctic Sound – M

En plus du Gaudi2, Intel a également parlé d’un GPU pour les centres de données multimédias nommé Arctic Sound – M. Chaque carte Arctic Sound – M comprend jusqu’à quatre moteurs multimédias Xe, jusqu’à 32 unités de ray-tracing et cœurs Xe, une accélération matérielle pour le codec AV1 et dispose d’une accélération XMX AI intégrée. Intel a déclaré qu’une seule carte peut prendre en charge plus de 30 flux vidéo 1080p ou plus de 40 flux de jeu pour les jeux en nuage. Il prend également en charge jusqu’à 62 fonctions virtualisées pour les infrastructures de bureau virtuel.

Arctic Sound – M sera disponible sur les cartes PCIe de quatrième génération au troisième trimestre de 2022.

Pour plus de détails, l’article original (en anglais) est disponible sur le site d’IT World Canada, une publication sœur de Direction informatique.

Projet pilote d’IA soutenant la demande en électricité des véhicules à Ottawa

Québec lance un appel de projets en matière d’intelligence artificielle

Traduction et adaptation française par Renaud Larue-Langlois

Plus d'articles de Tom Li

Intel Vision 2022 : le processeur Habana Gaudi2 concurrence le Nvidia A100

Microsoft annonce de nouveaux outils de gestion de la chaîne d’approvisionnement

Les pièces jointes aux courriels Outlook.com seront comptabilisées dans le stockage OneDrive

Meta licencie 11 000 employés car son pari sur le métavers ne porte toujours pas fruits

Articles connexes

Intel se lance dans l’aventure avec de nouvelles offres centrées sur l’IA

Intel parle de la « siliciumnomie » lors de sa conférence sur l’innovation

Décès de Gordon Moore, le co-fondateur d’Intel et une icône de l’industrie

Mauvaise journée pour Intel dont la cote a baissé… mais une bonne journée pour AMD

Des résultats et des prévisions sombres pour les géants de la technologie

Emplois en vedette

OBTENEZ LES NOUVELLES ET LES PERSPECTIVES QUI COMPTENT POUR VOUS

Nouvelles

Malgré les défis, l’embauche se poursuit au Canada selon une étude de Robert Half

L’opposition tape sur la cheffe de l’ASPC concernant l’appli ArriveCAN.

Le monde selon Hinton: Ralentir l’IA n’est pas la solution

Catégories Populaire

Réseau ITWC

Autre