Written by: Samira Njoya
En donnant accès à des ressources vocales multilingues, Google veut favoriser l’émergence d’outils d’IA adaptés aux réalités locales, avec des applications potentielles dans l’éducation, la mobilité, les services financiers et la communication numérique.
Google a annoncé lundi 2 février le lancement de WAXAL, une base de données vocale conçue pour faciliter le développement de technologies d’intelligence artificielle adaptées à l’Afrique subsaharienne. L’ensemble des données couvre 21 langues, dont le yoruba, acholi, hausa, luganda, malagasy et shona, et contient plus de 11 000 heures d’enregistrements audio provenant de près de 2 millions d’enregistrements individuels.
« Nous voulions capturer la façon dont les gens parlent vraiment, alors nous avons demandé aux participants de décrire différentes images dans leur langue maternelle. Nous avons également enregistré des acteurs vocaux professionnels en studio pour créer l’audio de haute qualité nécessaire à la technologie du texte à la parole », a expliqué Google dans un communiqué.
Selon Google, WAXAL comprend 1 250 heures de discours transcrits pour la reconnaissance automatique de la parole et plus de 20 heures d’enregistrements studio pour la synthèse vocale (text-to-speech). La collecte a été réalisée en collaboration avec des partenaires africains, notamment l’Université Makerere en Ouganda, l’Université du Ghana et Digital Umuganda au Rwanda. Des experts régionaux ont assuré la qualité des enregistrements pour les applications professionnelles.
La mise à disposition de WAXAL se fait en licence ouverte sur la plateforme Hugging Face, ce qui permet aux chercheurs et développeurs d’accéder librement aux données. L’objectif affiché est double : stimuler l’innovation dans les technologies vocales en Afrique et contribuer à la préservation numérique des langues locales.
Selon les estimations de l’UNESCO, l’Afrique compte entre 1500 et 3000 langues distinctes, mais la majorité des outils numériques ne prend en charge que quelques langues principales. L’absence de données de qualité constitue un frein majeur à l’essor des assistants vocaux, des applications éducatives ou des outils de transcription automatique sur le continent.
Outre WAXAL, plusieurs projets locaux en Afrique cherchent à combler le déficit de données vocales. Au Bénin, l’initiative « JaimeMaLangue » mobilise les citoyens pour construire une base nationale en langues locales ; des jeux de données comme African Voices (Nigeria) ou African Next Voices (Mali) enrichissent les corpus pour des langues sous-représentées. Des programmes universitaires en Afrique de l’Est développent des ressources pour le luganda, le swahili et d’autres langues, contribuant ainsi à un écosystème plus robuste pour les technologies vocales africaines.
Samira Njoya
Lire aussi:
Le Bénin lance un projet d’IA pour donner une existence numérique aux langues locales
