20 / 10 / 2016
#Microsoft Research

Reconnaissance vocale : une intelligence artificielle atteint le niveau de l’homme

  • Linkedin
Une équipe de Microsoft Research vient d'annoncer avoir développé une intelligence artificielle capable de distinguer les mots d'une conversation avec autant d'efficacité qu'un humain. Explications.

«Il y a cinq ans je n’aurais jamais imaginé que nous pourrions réaliser cette performance. Je ne pensais pas que ce serait possible. » Il y a un mois, l’équipe de chercheurs de la cellule de Microsoft Research dédiée à la parole et au discours atteignait 6,3% de taux d’erreur par mot (WER –word error rate) avec leur logiciel de reconnaissance vocale. Désormais, le groupe vient de franchir un nouveau palier en obtenant seulement 5,9% de taux d’erreur par mot.

« Cet accomplissement est le point culminant de plus de vingt ans d’efforts », a déclaré Geoffrey Zweig, directeur du groupe de recherche. Pour la première fois, une intelligence artificielle peut en effet reconnaître les mots d’une conversation aussi bien que le ferait une personne. « Nous avons atteint la parité humaine. C’est un accomplissement historique », confirme Xuedong Huang,chief speech scientist.

Et le chemin parcouru est important : il y a vingt ans, le meilleur logiciel de reconnaissance vocale disponible sur le marché se trompait sur… près d’un mot sur deux (43%).

A terme, cette avancée devrait avoir des impacts concrets sur tous les produits et services de l’entreprise faisant appel à la reconnaissance vocale, que ce soit l’assistant intelligent Cortana, la console Xbox ou encore les outils de retranscription automatisée de la parole.

La prochaine étape pour les chercheurs ? « Passer de la reconnaissance vocale à la compréhension », avance Geoffrey Zweig.

Pour en savoir plus, c’est parici.