L’offensive de l’IA générative s’est poursuivie hier avec VMware Inc. et NVIDIA annonçant l’expansion d’un partenariat qui, selon les partenaires, est conçu pour « préparer les centaines de milliers d’entreprises qui fonctionnent sur l’infrastructure infonuagique de VMware à l’ère de l’IA générative ».
Le point central du lancement, qui a eu lieu lors de la conférence des utilisateurs et partenaires VMware Explore 2023 qui se tient cette semaine à Las Vegas, est une plate-forme qui, selon les deux sociétés, comportera le logiciel d’IA générative et « l’informatique accélérée » de NVIDIA, construite sur VMWare Cloud Fondation et optimisé pour l’IA.
Ils ont déclaré dans un communiqué que « pour obtenir plus rapidement des avantages commerciaux, les entreprises cherchent à rationaliser le développement, les tests et le déploiement d’applications d’IA générative. McKinsey estime que l’IA générative pourrait ajouter jusqu’à 4,4 billions de dollars américains par an à l’économie mondiale.
En projetant ce chiffre, publié en juin, McKinsey a déclaré que « l’ère de l’IA générative ne fait que commencer et qu’il faudra du temps pour prendre pleinement conscience des énormes avantages de la technologie. Mais les chefs d’entreprise devraient commencer à mettre en œuvre des cas d’utilisation de l’IA générative dès que possible plutôt que d’attendre les bras croisés, car l’écart de performance entre les retardataires et les premiers utilisateurs va rapidement se creuser. »
« L’avantage concurrentiel ira aux organisations qui seront les premières à utiliser l’IA générative pour accélérer leurs priorités commerciales, leurs innovations et leur croissance. En termes simples, les chefs d’entreprise doivent s’épanouir dès maintenant dans l’IA générative (quiconque peut poser des questions peut utiliser la technologie) et être prêts à apprendre en permanence. »
La nouvelle plate-forme, qui s’appellera VMware Private AI Foundation with NVIDIA, « permettra aux entreprises de personnaliser des modèles et d’exécuter des applications d’IA génératives, y compris des robots conversationnels intelligents, des assistants, la recherche et la synthèse ».
Il sera construit sur les logiciels VMware Cloud Foundation et NVIDIA AI Enterprise. Krish Prasad, vice-président senior et directeur général du groupe commercial d’infrastructure infonuagique de VMware, a écrit dans un article de blog publié peu après l’annonce officielle que, bien que « l’IA générative soit une technologie transformatrice, les entreprises sont confrontées à des défis de taille lors de son déploiement ».
Il s’agit notamment, a-t-il déclaré :
- Confidentialité : Les données d’entreprise et la propriété intellectuelle sont privées et d’une importance cruciale lors de la formation de grands modèles de langage pour répondre aux besoins spécifiques de l’organisation. Ces données doivent être protégées pour éviter toute fuite en dehors des limites de l’organisation.
- Choix : Les entreprises doivent être en mesure de choisir le grand modèle de langage (GML) qui correspond le mieux à leur parcours d’IA générative et à leurs besoins organisationnels. L’accès à un vaste écosystème et à une variété de choix est essentiel.
- Coût : Les modèles d’IA générative sont complexes et coûteux à concevoir, car ils évoluent rapidement avec de nouveaux fournisseurs, des composants SaaS et des logiciels d’IA de pointe lancés et déployés en permanence.
- Performance : La demande sur l’infrastructure connaît une augmentation substantielle lors des tests de modèle et lorsque les requêtes de données sont exécutées. Les grands modèles de langage, de par leur nature même, nécessitent généralement la gestion d’énormes ensembles de données. Par conséquent, ces modèles peuvent imposer des exigences d’infrastructure importantes, entraînant des problèmes de performances.
- Conformité : Les organisations de différents secteurs ont des besoins de conformité différents auxquels les solutions d’entreprise, y compris l’IA générative, doivent répondre. Le contrôle d’accès et la préparation à l’audit sont des aspects essentiels à prendre en compte.
Conçue pour relever les cinq défis, la plate-forme, ont déclaré les deux sociétés, comportera « NVIDIA NeMo, un cadre natif du nuage de bout en bout inclus dans NVIDIA AI Enterprise – le système d’exploitation de la plate-forme NVIDIA AI – qui permet aux entreprises de créer, personnaliser et déployer des modèles d’IA génératifs pratiquement n’importe où. NeMo combine des cadres de personnalisation, des boîtes à outils de garde-fou, des outils de conservation de données et des modèles pré-entraînés pour offrir aux entreprises un moyen simple, rentable et rapide d’adopter l’IA générative ».
« Grâce à cela, VMware Private AI Foundation with NVIDIA permettra aux entreprises d’extraire leurs propres données pour créer et exécuter des modèles d’IA génératifs personnalisés sur l’infrastructure infonuagique hybride de VMware. »
Dans un discours prononcé mardi, où il était accompagné du fondateur et PDG de NIVIDIA, Jensen Huang, le PDG de VMware, Raghu Raghuram, a comparé ce qui se passe actuellement sur le front de l’IA générative à l’arrivée de l’ordinateur personnel il y a 40 ans, ou à l’arrivée d’Internet, qui ont tous deux déclenché une « toute nouvelle vague d’innovation en matière d’applications ».
Dans un communiqué, il a déclaré que « les données des clients sont partout – dans leurs centres de données, à la périphérie et dans leurs nuages. En collaboration avec NVIDIA, nous donnerons aux entreprises les moyens d’exécuter leurs charges de travail d’IA générative à côté de leurs données en toute confiance, tout en répondant à leurs préoccupations en matière de confidentialité, de sécurité et de contrôle des données d’entreprise ».
Lors d’une conférence de presse tenue lundi pour annoncer le lancement, Paul Turner, vice-président de la gestion des produits vSphere chez VMware, a déclaré qu’il s’agissait d’un « espace très nouveau, il est difficile pour les gens de réellement comprendre quels sont les applications et services les plus importants et les boîtes à outils dont ils ont besoin, et comment obtenir ces boîtes à outils prescrites aussi facilement que possible. Et c’est l’une des choses que nous considérons en tant que partenaire : nous voulons rendre cela très simple pour nos clients ».
Ils ne feront pas non plus cavalier seul. Il a été annoncé mardi que la plate-forme serait prise en charge par Dell Technologies, Hewlett-Packard Enterprise et Lenovo, « qui seront parmi les premiers à proposer des systèmes qui dynamisent les charges de travail de personnalisation et d’inférence GML d’entreprise avec les GPU NVIDIA L40S, les DPU NVIDIA BlueField – 3 et les Cartes SmartNIC NVIDIA ConnectX-7 ».
Interrogé sur les prix et la disponibilité lors d’une séance de questions-réponses avec les médias et les analystes, Paul Turner a déclaré que les prix n’avaient pas encore été déterminés et que la disponibilité générale de la plate-forme était attendue au début de l’année prochaine.
Adaptation et traduction française par Renaud Larue-Langlois.