Il y a environ six mois, un groupe d’ingénieurs et de développeurs ayant travaillé pour la NSA (l’agence américaine de sécurité nationale), Google et Amazon Web Services a eu l’idée de créer une sorte de GitHub des données.
Baptisée Gretel, cette plateforme vise à donner la possibilité aux développeurs de partager en toute sécurité des données sensibles et de collaborer les uns avec les autres.
Constatant que Github avait permis d’offrir une plus grande accessibilité au code source et de faciliter la collaboration, ils ont décidé de créer un équivalent pour les données.
Pour résumer, Gretel utilise l’apprentissage machine pour anonymiser les jeux de données avant qu’ils ne soient partagés aux autres utilisateurs de la plateforme.
« Présentement, nous développons des logiciels pour permettre aux développeurs de vérifier automatiquement une version anonymisée des jeux de données », a expliqué Alex Watson, l’un des cofondateurs de Gretel, au site TechCrunch.
Les données obtenues sont artificielles, et donc sans risque, mais elles ressemblent à de vraies données sensibles.
La jeune pousse Gretel a reçu 3,5 millions de dollars américains de financement de la part de plusieurs investisseurs afin de finaliser sa plateforme, qui devrait être lancée d’ici six mois.