Un regard sur le développement de la reconnaissance vocale – comment une machine à calculer futuriste devient un logiciel établi
Depuis des décennies, les passionnés de technologie s’intéressent à la transformation automatique de la parole en texte. Il a fallu de nombreuses années avant que la reconnaissance vocale ne devienne ce qu’elle est aujourd’hui : une technologie établie et largement répandue permettant de créer des documents de manière plus efficace.
La technologie fait d’énormes progrès
Tout le monde se souvient des premières tentatives de commande vocale pour composer un numéro sur les téléphones mobiles. La plupart du temps, les commandes vocales n’étaient pas comprises et un mauvais numéro était saisi. Pour différentes raisons, il a fallu un certain temps avant que la reconnaissance vocale arrive à maturité. D’importants progrès ont toutefois été réalisés au cours des dernières années. La reconnaissance vocale est aujourd’hui un instrument établi et largement répandu permettant d’optimiser les processus et d’augmenter l’efficacité. Ce sont surtout les cabinets médicaux, les hôpitaux et les cabinets d’avocats qui misent sur la reconnaissance vocale, afin d’avoir plus de temps à consacrer aux patients et aux clients. Après la présentation par IBM d’une machine de la taille d’une boîte à chaussures capable de résoudre des problèmes de calcul simples dictés oralement lors de l’exposition universelle de 1962, la reconnaissance vocale a eu du mal à évoluer. Le degré de probabilité qu’un mot donné en suive un autre n’a pu être calculé que dans les années 80 à l’aide du « modèle de Markov caché », baptisé selon le nom du mathématicien russe Andrej Markov. Ceci a permis de différencier des phrases à la prononciation similaire ou identique en fonction du contexte.
Les fondations ont été posées dans les années 80
Le premier système de reconnaissance vocale pour ordinateur a finalement vu le jour au début des années 90. Pendant ce temps, IBM, Lernout & Hauspie, Dragon Systems, Philips et Microsoft étaient en concurrence avec leurs produits respectifs. Au cours d’une phase de consolidation difficile après la fin du millénaire, le fabricant Scansoft, qui a plus tard été rebaptisé Nuance Communications, a repris plusieurs petites sociétés et technologies. Les technologies d’IBM et de Philips (SpeechMagic) appartiennent désormais également à Nuance.
Des progrès impressionnants
C’est au cours des dix dernières années que la reconnaissance vocale a réellement réussi à percer grâce aux logiciels, à la puissance de calcul et au vocabulaire technique de plus en plus performants. Même si la technologie est aujourd’hui bien établie, nombreux sont les professionnels qui continuent à utiliser un clavier pour rédiger leurs e-mails et leurs rapports. Dans les branches où le flux de documentation est important, il est toutefois relativement plus efficace et plus facile de rédiger les textes à l’aide de la reconnaissance vocale. La courte période d’apprentissage, la mise en pratique rapide et la grande précision de reconnaissance font des solutions de reconnaissance vocale professionnelles un outil hautement efficace.
Avec ses produits Dragon Medical, Dragon Professional et Dragon Legal, Nuance Communications est aujourd’hui leader du marché des logiciels de reconnaissance vocale. « Comparé aux produits concurrents, Dragon se distingue par une précision de reconnaissance optimale, que ce soit pour les textes généraux ou les textes spécialisés dans le domaine médical ou juridique », explique Reto Heusser, membre de la direction de Voicepoint. La technologie Nuance peut également être intégrée dans d’autres applications. Elle offre des options de navigation simples pour l’ordinateur ainsi que des processus de correction efficaces et le plurilinguisme. En tant qu’intégrateur suisse de Nuance, Voicepoint propose avec Firebox un module complémentaire permettant de gérer les logiciels et les utilisateurs de manière automatique dans les cabinets médicaux et les hôpitaux.
La reconnaissance vocale – aujourd’hui, il est impossible d’imaginer la vie sans elle
Diverses innovations attendent également les utilisateurs dans les années à venir. Par exemple, dans ses dernières versions, Nuance a mis en œuvre une technologie d’apprentissage basée sur les réseaux neuronaux (Intelligence artificielle) en plus des modèles statistiques et a amélioré les vocabulaires, ce qui a permis d’obtenir une reconnaissance encore plus précise. En outre, Voicepoint présente également le Firebox Server, le complément parfait du logiciel client Firebox développé par Voicepoint, ce module présente des fonctions de gestion d’entreprise avancées. De plus, Voicepoint a étoffé son offre sur sa plateforme suisse de reconnaissance vocale dans le cloud, qui est hautement disponible et sécurisée, basée sur la technologie Dragon de Nuance, et qui a été lancée avec succès l’année dernière. « Notre plateforme permet aux médecins d’accéder à la reconnaissance vocale à tout moment et depuis n’importe quel endroit, quel que soit leur environnement informatique et sans avoir à maintenir leur propre installation », a déclaré Reto Heusser, résumant les principaux avantages de la solution.
Vous avez des questions sur nos produits et services ou vous souhaitez un conseil personnalisé ? Contactez-nous – c’est avec plaisir que nous sommes à votre disposition.