Le Centre de recherche informatique de Montréal (CRIM) se lance dans l’application de ses technologies de reconnaissance vocale à la préservation des langues autochtones.
Ce travail, qui vise à contribuer à l’enseignement, à la revitalisation et à la préservation des langues autochtones, sera réalisé en partenariat avec le Conseil national de recherches du Canada (CNRC).
Le CRIM, qui possède de l’expérience en technologies textuelles et liées à la parole, travaillera ainsi sur deux projets qui sont destinés à permettre le développement d’une douzaine de systèmes de reconnaissance de la parole pour les langues autochtones.
Le premier projet consiste à concevoir des systèmes de segmentation des enregistrements audios capables de reconnaître les langues parlées, d’isoler la parole des bruits et musiques, ainsi que de distinguer les personnes qui parlent.
Le second projet cible la conception d’un outil d’indexation pour organiser les contenus linguistiques audios déjà existants et ainsi pouvoir naviguer plus rapidement au sein des enregistrements audios.
« Il existe des milliers d’heures d’enregistrements de langues autochtones, mais ceux-ci sont malheureusement rarement annotés ou indexés dû au manque de technologies pour le faire. Cette situation est frustrante pour les membres des communautés concernées, qui aimeraient pouvoir faire des recherches à l’aide de mots-clés pour trouver des enregistrements pertinents à leurs besoins actuels », a expliqué, par communiqué, Roland Kuhn, responsable du projet sur les technologies pour les langues autochtones au CNRC.
Les chercheurs du CRIM et du CNRC se concentreront au début sur l’inuktitut et le cri, en espérant que leurs technologies soient appliquées à d’autres langues ensuite. Environ 70 langues autochtones sont parlées au Canada.
Lire aussi :
Du financement pour l’annotation collaborative de contenu multimédia