Les ingénieurs responsables Google Voice ont retravaillé en profondeur les algorithmes derrière Google Voice. Désormais, Google Voice est capable d’isoler plus facilement la voix de l’utilisateur et réagit beaucoup plus rapidement à ses demandes.

google voice

Si ces derniers temps, vous avez remarqué que la recherche vocale sur votre téléphone Android était beaucoup plus réactive et précise, ce n’est pas qu’une impression. Les ingénieurs de Google derrière Google Voice ont en effet publié un long article sur le blog Google Research expliquant qu’ils ont retravaillé une bonne partie des algorithmes de la reconnaissance vocale.

Si vous êtes développeur et que la linguistique et les algorithmes vous passionnent, cet article devrait particulièrement vous plaire. Il est en revanche beaucoup plus compliqué à appréhender pour monsieur tout le monde. L’équipe annonce en effet avoir conçu « un meilleur réseau de modèle acoustique » utilisant la « Connectionist Temporal Classification (CTC) » et des « techniques de séquences d’entraînement discriminatoires » (sequence discriminative training techniques).

Plus concrètement, Google Voice est maintenant capable de prédire plus facilement les mots en se basant sur la façon dont l’utilisateur prononce certains phonèmes. Un algorithme se charge alors d’analyser la façon dont il est prononcé, et d’anticiper ce qui devrait suivre logiquement, de façon grammaticale. À la façon d’un être humain, en quelque sorte, Google Voice peut plus ou moins deviner la suite d’une phrase avant qu’elle soit finie.

Google sous-entend que le procédé était déjà connu et fonctionnait déjà auparavant. Mais il demandait alors un délai de 300 ms, le temps de l’analyse. Le véritable tour de force a été de rendre le processus le plus rapide possible et d’utiliser des algorithmes afin d’améliorer le système de prédiction. Le résultat est sous vos yeux, puisqu’il suffit de lancer Google Now, par exemple, pour admirer cette plus grande précision.

Comments

comments

No related posts.