L'appart épisode 17 : Frédéric Delahais, vice-président de Nuance Communications

Vignette de la vidéo Piste de sous-titres Vidéos en relations
<embed src="http://www.sfr.com/sites/all/themes/sfr/swf/player.swf" flashvars="file=http://ncdn-video.sfr.com/lappart17/video.mp4" width="600" height="335" />

JWplayer | lappart17

Le 01 / 09 / 14 | Posté par la rédaction de SFR
L'appart épisode 17 : Frédéric Delahais, vice-président de Nuance Communications

Tous les 15 jours, L’appart reçoit un décideur de l'innovation pour un entretien vidéo mené par Jérôme Colombain et François Sorel, de La Chaîne Techno en coproduction avec SFR. Entrepreneurs, chefs d'entreprise, créateurs de start-up… Ils nous font part de leurs succès, mais aussi des échecs qui leur ont permis d’avancer, et nous donnent leur point de vue sur les dernières tendances en matière d'innovation.

Pour ce 17ème épisode de L’appart, nous recevons Frédéric Delahais, vice-président de Nuance Communications, société américaine leader sur le marché de la reconnaissance et de la synthèse vocale. Pour ce passionné nouvelles technologies, la grande innovation de demain sera dans la sécurisation des opérations de la vie courante grâce à la voix, signature unique pour chaque personne, au même titre que les empreintes digitales.

Frédéric Delahais dirige la branche européenne et de la société américaine Nuance, spécialisée dans la reconnaissance vocale. Nuance édite le célèbre logiciel de dictée vocale "Dragon". On trouve aussi des solutions Nuance dans les téléphones mobiles, les voitures et même certains appareils audiovisuels et électroménagers. Frédéric Delahais est chargé de la commercialisation de ces technologies en France, en Europe et au Moyen-Orient.

Transcript de la vidéo :

La Chaîne Techno (LCT) : Bonjour à tous et bienvenue sur la chaîne Techno, et bienvenue dans ce nouveau numéro de L’appart. L’appart, vous le savez, c’est toutes les deux semaines un entretien privilégié avec un décideur de l’innovation.
- Et aujourd’hui nous parlons reconnaissance vocale. Nous recevons Frédéric Delahaye*, vice-président Europe de la société Nuance.

 # REPORTAGE

 LCT : Bonjour Frédéric Delahais.

Frédéric Delahais (FD) : Bonjour.

LCT : Bonjour et merci d’avoir accepté notre invitation dans L’Appart. Alors on va parler avec vous de reconnaissance vocale aujourd’hui. Est-ce que vous pouvez nous présenter Nuance ?

FD : Eh bien nous sommes une société américaine, leader sur le marché des technologies de la voix, reconnaissance vocale, mais aussi synthèse vocale.

LCT : Alors c’est vrai que la reconnaissance vocale, aujourd’hui, on la trouve presque partout, notamment dans les ordinateurs, dans les smartphones. Vous êtes derrière pas mal de services et de marques connues, et on ne le sait pas forcément.

FD : Absolument, oui, nous avons plusieurs go-to-market. Nous vendons directement aux clients finaux, par exemple, pour la solution Dragon que vous utilisez sur votre PC ou sur votre Mac.

LCT : Dragon, c’est ce fameux logiciel qui permet de dicter des lettres ou de commander son PC, son ordi.

FD : Absolument. Tout à fait. Et nous vendons aussi à des intégrateurs qui eux-mêmes vont revendre ensuite à des fabricants automobiles, par exemple, nous sommes présents sur quasiment 70 % du marché automobile, ou les fabricants de téléphones ou récemment les fabricants de téléviseurs.

LCT : C’est-à-dire que la reconnaissance vocale arrive dans l’automobile ? C’est assez récent ça. On a déjà des voitures qui obéissent à la voix ?

FD : Alors, elles n’obéissent pas complètement à la voix. Il va s’agir de pouvoir, à la voix, par exemple, gérer son GPS, gérer la musique qu’on écoute ; ou BMW vient de sortir un système qui permet de dicter en conduisant ses SMS ou ses e-mails.

LCT : C’est encore sur les modèles haut de gamme ?

FD : Absolument, oui.

# TIMELINE

LCT : Nuance, en fait, ça fait plusieurs années que ça existe. Quand est-ce que cette boîte a été créée ?

FD : Écoutez, j’ai rejoint Nuance en 1998, donc une quinzaine d’années, et c’est dans les années 2001-2002 que nous avons pénétré le marché de la reconnaissance vocale, avec la première acquisition qui était celle de Lernout & Hauspie, une société belge qui avait développé le premier système de reconnaissance vocale. Et depuis, 78 acquisitions plus tard, nous sommes devenus le leader mondial de cette techno.

LCT : En 2001, à l’époque, c’était quelque chose qui était...

- C’était l’Odyssée de l’espace !
- Voilà, c’était l’Odyssée de l’espace, et puis surtout, c’était le tout début de la reconnaissance vocale. C’était un peu fastidieux, non, au départ ?

FD : Oui, absolument, c’était fastidieux. A l’époque, c’était un produit qu’utilisaient les avocats ou les médecins, parce qu’il était possible, et il est toujours possible d’ailleurs aujourd’hui, d’intégrer dans la version PC de Dragon un vocabulaire spécialisé qui permettait aux médecins d’intégrer des noms de médicaments, par exemple. Mais l’utilisation du logiciel de manière assez commune pour rédiger un e-mail, par exemple, était fastidieuse, assez longue. En dix ans, Nuance a développé le produit, d’une part, et on a aussi bénéficié de l’avancée par exemple de la puissance des PC, qui permettent de storer plus de data, plus de mots.

LCT : Vous avez besoin de puissance machine pour la reconnaissance vocale.

FD : Exactement, voilà. Et aussi, les micros qui sont devenus plus performants aujourd’hui, qui permettent d’isoler, en fait, même dans une salle bruyante, le dictant, de personnes qui pourraient être à côté, qui pourrait être une nuisance. Donc on a à la fois développé nos produits et bénéficié effectivement d’un environnement plus favorable de la part des fabricants de PC et de micros.

LCT : Donc Nuance petite start-up il y a encore quelques années, et aujourd’hui ?

FD : Ecoutez, on était 200 personnes en 1998. On est 12 000 aujourd’hui. On faisait 100 millions de chiffre d'affaires en dollars. On va faire 2,2 milliards cette année. Donc, une des plus grosses croissances de sociétés américaines sur le marché, oui.

LCT : La conquête, je dis la conquête parce que c’est un peu ça, la conquête de la reconnaissance vocale, se fait comment ? Ça a été une longue progression ou il y a eu des étapes importantes, des moments clés 

FD : Oui, le deuxième moment clé est en fait assez récent. Il est le jour, certainement, où Steve Jobs a décidé d’intégrer la reconnaissance vocale dans un iPhone. Ce jour-là, je pense qu’Apple a montré que le produit était mature pour qu’on puisse « démocratiser » son utilisation. On en revient aux avocats ou aux médecins d’il y a quinze ans, c’était une « niche ». Aujourd’hui, c’est complètement démocratisé, n’importe qui peut utiliser la reconnaissance vocale sur quelque plateforme que ce soit, le PC ou son téléphone, son smartphone, pour une utilisation qui est aussi bien e-mail, SMS, ou professionnelle, avec Word ou Powerpoint par exemple.

LCT : Cette voix, les gens se posent souvent la question, est-ce que c’est une voix 100 % synthétique ? Est-ce que ce sont des mots enregistrés ? Est-ce que c’est un monsieur ou une dame qui parle ?

FD : Bien sûr, c’est une voix de synthèse. C’est un des sujets qui me passionne. En fait, on est capable aujourd’hui de créer des voix. On a des clients qui, par exemple, vont nous demander de créer une voix qui va leur permettre, en fait, d’identifier la société.

LCT : Mais vous partez quand même d’échantillons humains, ou pas du tout ?

FD : Oui, d’échantillons humains qu’on peut ensuite mélanger les uns aux autres. Et on est capable aujourd’hui de faire ce qu’on appelle une « custom voice », une voix customisée.

LCT : Et on pourrait prendre la voix... le timbre de voix de Jérôme est le faire parler, lui faire raconter à peu près n’importe quoi. Ce serait amusant quand même.

FD : On peut en parler à votre employeur. On peut effectivement recréer votre voix et vous pouvez rester à la maison.

LCT : Et qu’il puisse écrire des chroniques radio et...

FD : Absolument.

LCT : Ce serait top.
- Vous m’en mettrez deux.
-
Il n’y a pas de souci, on est preneur.

# FAILS

LCT : Frédéric Delahais, j’imagine que malgré tout, il y a eu des moments un peu plus compliqués durant, on va dire, l’existence de Nuance. Quels sont les fails, à votre avis, de Nuance ?

FD : Ecoutez, lorsque la reconnaissance vocale est apparue sur le marché, il y a eu des attentes, certainement supérieures à ce que le produit pouvait à l’époque, il y a quinze ans, fournir en termes de qualité. Et je dirais que ce à quoi nous nous heurtons encore aujourd’hui, c’est de la part des gens, certains doutent : « Oui, j’ai entendu dire que la reconnaissance vocale ne marchait pas très bien. » Voilà, c’est ce doute.

LCT : Ca n’a pas forcément une bonne image, en fait.

FD : Je pense que les attentes ont été trop importantes par rapport à ce que ça pouvait fournir à l’époque. Aujourd’hui, on est là, la technologie, elle est mature. Mais il y a encore certaines personnes qui peuvent avoir des doutes et c’est ce que nous devons, au quotidien, en fait...

LCT : Mais c’est vrai qu’il y a parfois des choses un peu déceptives. Vous parliez de Dragon, ce logiciel de dictée vocale. Au début, il fallait un long apprentissage.

FD : Il y avait une période d’apprentissage, etc.

LCT : Il fallait dire des textes pendant une heure...

- Il fallait vraiment vouloir l’utiliser. Ce n’était pas très plug and play.

FD : Tout à fait. C’est pour cela que nos premiers utilisateurs étaient des médecins et des avocats, parce que sur la durée, le retour sur investissement valait la peine, en fait.

# INNOVATION

LCT : Frédéric Delahaye*, un mot sur votre vision de l’innovation, soit dans le domaine de la reconnaissance vocale ou dans tout autre domaine, qu’est-ce qui vous fait rêver dans le domaine de l’innovation et qui va peut-être, à votre avis, changer notre quotidien dans quelques années ?

FD : Je pense que la biométrie, qui est un sujet sur lequel Nuance travaille aussi d’ailleurs, va être quelque chose d’important. La biométrie, c’est la possibilité de reconnaître l’empreinte vocale de chaque individu, qui va permettre aussi de dissocier, en fait, la personne par rapport à une autre. Ça a des avantages d’un point de vue de la sécurité, par exemple.

LCT : A quoi ça pourrait servir ?

FD : L’identification individuelle, par exemple, peut remplacer un passeport un jour, et d’ores et déjà, aujourd’hui, est utilisée par une banque anglo-saxonne, qui va permettre au système de reconnaître l’individu sans avoir à entrer un mot de passe. Et cette personne pourra ensuite effectuer des mouvements bancaires via le téléphone.

LCT : Tout à l’heure, vous avez évoqué dans les innovations futures, dans le domaine de la reconnaissance vocale, la biométrie. Par exemple, ma voix est unique au monde ? Alors bon, sans parler de sa qualité, on a un timbre de voix unique, un peu comme une espèce d’empreinte digitale ? Est-ce qu’un Nicolas Canteloup ou un Laurent Gerra pourrait ouvrir ma porte et m’imiter ? Ou est-ce que c’est plus compliqué que ça ?

FD : Je pense que c’est plus compliqué que ça. Effectivement, l’empreinte vocale comme l’empreinte digitale est absolument unique. On a passé des accords avec une grosse banque anglo-saxonne, qui a ouvert un service qui permet à ses clients d’être identifiés par l’empreinte vocale. Ces clients peuvent ensuite passer des ordres de bourse au téléphone. Donc, c’est d’un point de vue sécurité quelque chose qui est très, très performant.

LCT : Alors, Nuance est une entreprise américaine, mais vous avez des ingénieurs, des centres de recherche aussi en Europe ?

FD : Oui, absolument. On a des centres de recherche un petit peu partout. En Europe, par exemple en Hongrie, en Ukraine, en Angleterre et en Belgique.

LCT : Pas en France ?

FD : Pas en France, non.

LCT : Des ingénieurs français ?

FD : On a des ingénieurs français. On a beaucoup de linguistes français, effectivement, bien sûr. Mais ce sont des gens qui ont été délocalisés aux États-Unis.

LCT : Ah oui…

FD : Pas pour des raisons fiscales, je le précise. Je sentais la question arriver. D’accord.

# PORTRAIT_DE_GEEK

LCT : Frédéric Delahais, on va terminer un petit peu avec des questions plus personnelles. Est-ce que vous êtes un geek ?

- Est-ce que vous aimez les nouvelles technologies ?
- Est-ce que vous parlez à votre smartphone ? Et quel smartphone avez-vous ?

FD : Ecoutez, je suis geek, mais ma fille est encore plus geek que moi. Et je pense que les générations à venir, aujourd’hui, vont être encore plus friandes de ce genre d’opérations. Je parle de ma fille, car elle me subjugue, elle utilise la reconnaissance vocale à neuf ans pour interagir avec ses amis. Elle dicte ses e-mails. Elle dicte ses SMS. Et elle m’a dit un jour : « Papa, pourquoi est-ce que tu utilises un clavier ? » Et je pense que c’est un signe...

LCT : Plus royaliste que le roi…

- Je pense que c’est elle qu’on aurait dû inviter finalement.

FD : Elle aimerait être sur un plateau, c’est sûr. Mais je pense... Vous savez, il y a une quinzaine ou une vingtaine d’années, lorsque les ordinateurs sont arrivés, les secrétaires avaient du mal à croire qu’un jour on pourrait leur retirer leur machine à taper. Je pense que l’évolution de nos technos va aller très vite, et ça va rentrer dans les mœurs, oui.

LCT : Alors, vous êtes plutôt iPhone, Android, Windowsphone, Blackberry ?

FD : Alors, une réponse de Normand : en fait, je suis iPhone pour lire mes e-mails et je suis Blackberry pour les écrire.

LCT : C’est original. Donc, vous avez deux smartphones ?

FD : Absolument, oui.

LCT : Et pourquoi vous ne vous servez pas de la dictée vocale sur l’iPhone pour lire vos mails ?

- C’est la question piège.

FD : Alors je le fais sur le Blackberry. Je dois le faire en anglais lorsque je travaille, et j’ai une version française installée sur mon PC.

LCT : Les réseaux sociaux. Est-ce que vous êtes présent sur Facebook, Twitter ? Est-ce que c’est un domaine qui... ?

- On peut twitter à la voix aussi.

FD : Voilà, absolument, on peut twitter à la voix. On peut mettre à jour son profil Facebook à la voix.

LCT : Il faut bien relire avant de cliquer sur « envoi ».

FD : Il vaut mieux, effectivement.

LCT : Parce que moi, en général, quand je lui envoie des messages vocaux pour lui dire « bonjour », ou « salut », ça se transforme en « sushi » ou des choses comme ça.

- C’est ça, oui. La dernière fois, « bonjour », moi, c’était « blinis ». Donc c’est un peu bizarre. Donc tout dépend à qui on l’envoie, ça peut jeter un froid. Donc plutôt Facebook, Twitter. Vous êtes présent, vous, personnellement, sur les réseaux sociaux ?

FD : Non, pas personnellement, mais je pense que c’est quelque chose d’important, oui.

LCT : C’est vrai qu’on se rend compte aujourd’hui que demain, on pourra effectivement poster tous ses messages par la voix. Et ça marche déjà.

- Non parce que, c’est vrai qu’on plaisante et on en rigole, mais c’est un véritable outil aujourd’hui. Et vous l’avez dit, notamment en voiture. C’est assez formidable.

LCT : Frédéric Delahais, merci d’avoir été notre invité dans L’appart.

FD : Merci.

LCT : - Merci. Et puis, on se retrouve bien sûr dans deux semaines sur la chaîne Techno pour avoir encore un entretien privilégié avec un décideur lié à l’innovation. A bientôt.

- Salut à tous.

ALLER PLUS LOIN