Le marché de la reconnaissance vocale est en plein boom. Il devrait atteindre 185 milliards de dollars en 2021, contre seulement 90 milliards de dollars en 2015. On fait le point sur les tendances à venir avec Florian Guichon, chief operating officer de Vivoka, entreprise française spécialisée dans le domaine de la reconnaissance vocale pour professionnels.
Comment expliquez-vous l’essor de la reconnaissance vocale ?
Florian Guichon. Une des premières raisons est la démocratisation des technologies vocales d'une manière générale. Que ce soit par les GAFA (Google, Amazon notamment), ou par différents acteurs de l'écosystème (événements spécifiques à la VoiceTech, ouvrages, podcasts, etc.). La quasi-totalité des grands comptes sont en recherche de technologies vocales, et les assistants vocaux classiques sont de plus en plus nombreux. Il est estimé qu'il y aura plus d'assistants vocaux en 2023 que d'êtres humains. L'essor est présent actuellement grâce à la démocratisation et la compréhension des possibilités de ses technologies, que vous pouvez retrouver partout : dans votre voiture, chez vous, dans vos hôtels, dans vos lieux de travails, sur votre téléphone, etc.
Quelle est votre positionnement sur ce marché ?
F. G. Tout d'abord, nous sommes un éditeur de logiciel uniquement basé sur les solutions vocales depuis plus de 5 ans. Nous sommes pure-player. En plus d'avoir une équipe R&D en interne qui nous permet d'avoir la main sur absolument toute l'expérience, de A à Z, lors d'un développement de projet vocal, nous sommes également capables d'intégrer de nombreuses solutions techniques présente sur le marché. Nous avons la chance de pouvoir adapter notre technologie et répondre à des cas d'usages extrêmement spécifiques, tout en respectant la vie privée et la RGPD.
Aujourd’hui, 18 % des interactions avec les objets se font par la voix. Jusqu’où peut aller ce chiffre selon vous ?
F. G. Donner un chiffre exact est utopique. Cela-dit, nous pouvons affirmer que ce chiffre est enclin à progresser significativement. D'une part, par la démocratisation des possibilités dans l'IOT et de l'utilisation de la voix dans le domaine (nouveau secteur : hospitality, ehpad, etc.) avec de nouvelles fonctions. L'IOT a une opportunité de 151 milliards de dollars en 2018, et 1 567 milliards en 2025 (d'après IOT Analytics), et la voix aura une belle place dans le contrôle de ces objets.
Quels sont les freins à l’essor de la reconnaissance vocale ?
Autres articles
-
Les 5 innovations marketing qui vont révolutionner le secteur du retail
-
Marché de l’immobilier en berne : comment réagissent les professionnels du secteur ?
-
Les géants du cloud tiennent les entreprises en otage
-
L’impact de l’IA dans le secteur des Datacenters
-
Quels impacts ont les données du secteur informatique sur le climat ?
F. G. Le premier frein est simplement dû au niveau de maturité et d'adoption de la population générale. Aujourd'hui, peu de personnes savent exactement ce qu'il est capable -dans le détail et les spécificités- de faire avec les assistants vocaux et la reconnaissance vocale. C'est une innovation relativement récente ouverte au grand public, ce qui signifie que l'adoption doit prendre. Cela a été également le cas avec le tactile. Par ailleurs, afin d'aider cette adoption, il est nécessaire d'avoir des technologies réellement adaptées aux cas d'usages demandés et essentiels. La compréhension des technologies vocales et de ses possibilités amène la reconnaissance vocale sur des sujets "must have" et non seulement comme un gadget.
Par exemple, dans l'industrie, le contrôle par la voix permet d'améliorer les interactions avec les machines et le processus industriel global (plus besoin d'enlever les gants, rapidité d'exécution à un ordre dictée, etc.). Deuxième exemple, la dictée vocale permet d'aller environ cinq fois plus vite lorsque les mots sont dictés que de les taper sur le clavier, alors dans le cadre de compte-rendu des professionnels, un gain de temps essentiel est réalisé.
Par exemple, dans l'industrie, le contrôle par la voix permet d'améliorer les interactions avec les machines et le processus industriel global (plus besoin d'enlever les gants, rapidité d'exécution à un ordre dictée, etc.). Deuxième exemple, la dictée vocale permet d'aller environ cinq fois plus vite lorsque les mots sont dictés que de les taper sur le clavier, alors dans le cadre de compte-rendu des professionnels, un gain de temps essentiel est réalisé.
La question de la vie privée est un enjeu crucial pour le développement de la reconnaissance vocale. Quelles sont les solutions qui peuvent être mise en place pour assurer la sécurité de chacun ?
F. G. Tout d'abord, il y a de nombreuses sociétés n'ayant pas vocation à la revente de données ou à l'exploitation d'elles à but commercial ou malsain. De plus, la notion de Privacy-by-design sur les sujets Cloud peut être appliquée. Ensuite, il y a des technologies dîtes "embarquées", ce qui signifie qu'elle ne libère aucune donnée sur des serveurs distants dans un cadre BtoB. D'un point de vue technique d'utilisation, l'écoute se déclenche uniquement à partir du "mot-clé déclencheur" (dit : Wake up Word), ou lors de l'appui sur une touche prévue à cet effet.