Balado Hashtag Tendances, 21 septembre 2023 — Stable Audio, Microsoft EvoDiff, méga-usine de robots et améliorations à Google Bard

Balado Hashtag Tendances, 21 septembre 2023 — Cette semaine : Lancement de Stable Audio, EvoDiff de Microsoft pour générer de nouvelles protéines, Agility Robotics construira 10 000 robots humanoïdes par année et Google annonce des améliorations à Bard.

Lancement de Stable Audio

Stability AI annonçait récemment la première sortie publique de sa technologie Stable Audio, qui offre la possibilité d’utiliser de simples invites textuelles pour générer de courts clips audio. Stability AI est surtout connue comme l’organisation à l’origine de la technologie d’IA de génération d’image à partir de texte Stable Diffusion.

On se souviendra qu’en juillet, Stable Diffusion avait dévoilé son nouveau modèle de base SDXL pour une composition d’image améliorée. La société a donné suite à cette nouvelle en élargissant sa portée au-delà de l’image jusqu’au code, avec le lancement de StableCode en août.

Stable Audio est une nouvelle fonctionnalité, bien qu’elle soit basée sur bon nombre des mêmes techniques d’IA de base qui permettent à Stable Diffusion de créer des images. En effet la technologie de Stable Audio utilise un mode de diffusion, axé sur l’audio plutôt que sur les images, afin de générer de nouveaux clips audio.

La technologie derrière Stable Audio provient du studio de recherche interne de Stability AI pour la génération de musique appelé Harmonai, créé par Zach Evans. « Il s’agit en majeure partie de prendre les mêmes principes technologiques de génération d’images et de les appliquer au domaine de l’audio », a-t-il déclaré à VentureBeat.

La possibilité de générer des pistes audio de base grâce à la technologie n’est pas une nouveauté. Dans le passé, les individus ont pu utiliser ce que Zach Evans appelait des techniques de « génération symbolique ». Il a expliqué que la génération symbolique fonctionne généralement avec des fichiers MIDI qui peuvent représenter quelque chose comme un roulement de tambour par exemple. La puissance générative de l’IA de Stable Audio est quelque chose de différent, permettant aux utilisateurs de créer une nouvelle musique qui va au-delà des notes répétitives courantes avec la génération MIDI et symbolique.

Stable Audio fonctionne directement avec des échantillons audio bruts pour une sortie de meilleure qualité. Le modèle a été formé sur plus de 800 000 morceaux de musique sous licence de la bibliothèque AudioSparks.

EvoDiff de Microsoft pour générer de nouvelles protéines

Microsoft vient de présenter un référentiel d’usage général, appelé EvoDiff, qui, selon la société, peut générer des protéines « haute fidélité » et « diverses » à partir d’une séquence protéique. Il est différent des autres référentiels de génération de protéines, ne nécessitant aucune information structurelle sur la protéine cible, éliminant ainsi l’étape généralement la plus laborieuse.

EvoDiff est disponible en open source et il pourrait être utilisé pour créer des enzymes pour de nouvelles méthodes thérapeutiques et d’administration de médicaments, ainsi que de nouvelles enzymes pour des réactions chimiques industrielles, explique Kevin Yang, chercheur principal chez Microsoft.

« Nous envisageons qu’EvoDiff étendra les capacités d’ingénierie des protéines au-delà du paradigme structure-fonction vers une conception programmable axée sur la séquence » a déclaré à TechCrunch Kevin Yang, qui est l’un des cocréateurs d’EvoDiff. « Avec EvoDiff », poursuit-il « nous démontrons que nous n’avons peut-être pas réellement besoin de structure, mais plutôt que la séquence protéique est tout ce dont vous avez besoin pour concevoir de nouvelles protéines de manière contrôlable. »

Au cœur du référentiel EvoDiff se trouve un modèle de 640 millions de paramètres formé sur les données de toutes les différentes espèces et classes fonctionnelles de protéines.

Agility Robotics construira 10 000 robots humanoïdes par année

Agility Robotics, la société qui a créé le robot bipède Digit, a annoncé qu’elle s’apprêtait à développer son installation RoboFab, qui pourra construire plus de 10 000 robots Digit par an. L’usine sera construite à Salem, dans l’Oregon, et la société a déclaré à TechCrunch qu’elle avait commencé la construction initiale de l’usine de robots de 70 000 pieds carrés l’année dernière et qu’elle devrait ouvrir ses portes plus tard cette année.

« L’ouverture de notre usine marque un moment charnière dans l’histoire de la robotique : le début de la production en série de robots humanoïdes commerciaux », a déclaré Damion Shelton, co-fondateur et PDG d’Agility Robotics. « Nous avons créé Digit pour résoudre les problèmes difficiles de la main-d’œuvre d’aujourd’hui, tels que les blessures, l’épuisement professionnel, le roulement de personnel élevé et les pénuries de main-d’œuvre impossibles à combler, avec la vision ultime de permettre aux humains d’être plus humains. Lorsque vous développez une nouvelle technologie pour améliorer la société, l’étape la plus importante est celle où vous êtes capable de produire en masse cette technologie à une échelle où elle peut avoir un impact réel et généralisé. »

Google annonce des améliorations à Bard

Google annonçait mardi des mises à jour de son assistant Google Bard AI, sa version de ChatGPT, y compris l’intégration avec les applications Google (telles que Gmail, Docs, Drive, Google Maps, YouTube et Google Flights) et une fonctionnalité permettant de contrevérifier les réponses de Bard. La société a également ajouté la prise en charge de plus de 40 langues.

Le nouveau « bouton de double vérification » de Bard a été conçu pour contrer les confabulations dans lesquelles Bard produit des informations inexactes ou invente des choses (un concept souvent appelé « hallucinations » dans le domaine de l’IA). C’est un aveu public que Bard manque souvent d’exactitude et n’est pas une référence factuelle fiable.

Pour utiliser la fonction de double vérification, les utilisateurs peuvent cliquer sur un petit logo « G » sous les résultats de Bard. Bard effectuera une recherche sur le Web et mettra en surbrillance les phrases dans sa sortie qui correspondent positivement avec un surlignage vert. Les déclarations de barde qui contredisent les résultats de recherche Google sont surlignées en couleur pêche. D’après les expériences rapportées par ARS Technica, le bouton de double vérification a renforcé certaines déclarations mais n’a pas toujours détecté les défauts logiques dans son résultat.

Les autres mises à jour introduisent également des extensions Bard, qui sont des fonctionnalités facultatives qui permettent à l’assistant d’extraire des autres services de Google et de les intégrer dans une conversation Bard. Par exemple, Bard peut lire vos courriels stockés dans Gmail et extraire des dates pour planifier un voyage ou résumer un document de CV stocké dans Google Drive. Google indique que Bard peut également obtenir des informations en temps réel sur les vols et les hôtels, fournir des itinéraires Google Maps vers un aéroport ou suggérer des vidéos YouTube sur un sujet.


Écoutez également :

Hashtag Tendances, 14 septembre 2023 — Apple et l’IA, Chrome a 15 ans, Nvidia accélère ses GPU et dévoilement de l’iPhone 15

Hashtag Tendances, 7 septembre 2023 — La croissance d’OpenAI, Samsung Food, partenariat Meta-LG et un MacBook pas cher

Hashtag Tendances, 31 août 2023 — Attaque de rançongiciel, TikTok et le commerce électronique, Code Llama et une puce d’IA signée IBM


Hashtag Tendances fait partie du réseau de balados d’IT World. Visitez le site ITWorldCanada.com pour y écouter de pertinents balados d’actualités technologiques en anglais, ainsi que le site DirectionInformatique.com pour les balados en français.

De plus, ne manquez pas de vous abonner à notre infolettre au DirectionInformatique.com, afin de recevoir par courriel les nouvelles du secteur des technologies en français.

Renaud Larue Langlois
Renaud Larue Langlois
Un peu journaliste, un peu gestionnaire TI, totalement passionné de technologie. Après plus de 25 ans dans le domaine des TI, devenir rédacteur était tout naturel pour Renaud. C'est réellement une affaire de famille. Ses champs d'intérêt sont… tout, en autant que ça concerne la technologie. On peut le joindre à rlaruelanglois@directioninformatique.com.

#Hashtag Tendencies