Qu’est-ce qu’une Voice User Interface ?
La VUI c’est-à-dire « Voice User Interface » signifie en français interface utilisateur vocale. C’est une interface qui permet à l’utilisateur d’interagir avec un appareil comme l’ordinateur ou bien le smartphone, en utilisant la voix. La VUI offre à l’utilisateur l’occasion de contrôler sa machine, tout en gardant les yeux et les mains libres. Elles comportent, généralement, des assistants personnels intelligents à l’instar de Siri d’Apple, Alexa d’Amazon, Voice de Samsung ou encore l’assistant de la recherche Vocale Google.
Définition d’une Voice User Interface
La VUI a brisé le silence entre les humains et les machines. L’interface vocale permet à la machine de répondre à des commandes et à des questions en assurant l’interaction de l’utilisateur avec un assistant vocal.
Les appareils qui sont contrôlés par une interface vocale sont nommé VCD, « Voice command devise ». Il existe plusieurs dispositifs de commande vocale (VCD) par exemple les téléphones intelligents dit « smartphone », les montres intelligentes, les télévisions intelligentes etc. Une Voice user interface a plusieurs avantages :
- La rapidité : puisque dicter un message est beaucoup plus rapide que le taper.
- L’accessibilité : Certaines personnes sont dans l’incapacité de manipuler les appareils. Par contre, la VUI est accessible pour la majorité des utilisateurs parce qu’elle se base sur la parole.
- La facilité : quand vous êtes en train de conduire, de cuisiner ou quand vous êtes loin de votre appareil, parler est plus pratique qu’écrire. Ainsi, la VUI vous permet de garder les yeux et les mains libres lors de l’utilisation de votre appareil digital.
Les technologies qui assurent l’interaction homme-machine
Dans une Voice User Interface, l’échange entre l’utilisateur et l’appareil s’effectue par le biais de plusieurs techniques.
La captation de la voix
Il s’agit de l’étape numéro un. La machine commence par capter la voix avant de répondre. Plusieurs mots clés jouent le rôle d’un déclencheur; c’est le cas pour « Ok Google » et « Dis Siri »
La « RAP » ; la reconnaissance automatique de la parole
Il s’agit d’une technologie qui assure l’analyse de la voix humaine. Ainsi, la VUI peut faire la transcription textuelle de la commande vocale. Il existe deux types de reconnaissance automatique de la parole. D’abord, la reconnaissance monolocuteur qui concerne une voix individuelle.
Généralement utilisée par les entreprises car elle permet d’introduire le vocabulaire d’un métier dans le dictionnaire du logiciel. Ensuite, la reconnaissance multilocuteur. Elle vise plusieurs utilisateurs et s’adapte aux commandes du quotidien.
« Text to Speech »
Le TTS également appelé la synthèse vocale en français, est une technique informatique qui permet la transformation des graphèmes en des phonèmes. En d’autres termes, le « Text to Speech » consiste à transformer un texte en une transcription phonétique.
Cette transformation est une étape fondamentale pour le passage d’un texte orthographique écrit à un message vocal. Alors, le TTS est la production artificielle de la voix. La synthèse vocale renforce la relation de l’utilisateur avec l’appareil puisqu’elle crée une conversation naturelle entre les deux.
L’intelligence artificielle (IA) :
L’IA est un processus qui a amélioré la reconnaissance automatique de la parole et la synthèse vocale. C’est un ensemble de techniques qui permettent aux machines d’imiter l’intelligence humaine.
Grâce à ce processus, elles agissent comme les humains.
Parmi les branches de l’intelligence artificielle, il existe la compréhension du langage naturel, dite CLN. Celle-ci aide les assistants intelligents et les serveurs vocaux interactifs à mieux comprendre le langage de l’homme. Par conséquent, les demandes et les questions de l’utilisateur ne sont plus limitées à des formules prédéfinies.
Désormais, la machine comprend le langage humain et peut répondre à des requêtes qu’elle n’a jamais rencontrées auparavant.
Un assistant vocal, c’est quoi ?
Chaque assistant intelligent doit répondre à des caractéristiques bien déterminées.
Présentation de l’assistant vocal
Un assistant vocal nommé assistant personnel est un logiciel qui réalise les tâches demandées par un utilisateur. L’interaction entre l’homme et l’assistant intelligent peut être effectuée par la voie d’une commande textuelle mais surtout à travers une commande vocale. En d’autres termes, l’utilisateur peut interagir avec son assistant par le biais de l’écriture ou bien grâce à la parole. L’enceinte connectée ou ce que certains appellent l’enceinte vocale est un haut-parleur sans fil intégré dans un assistant vocal. Elle favorise les services distants puisqu’elle est basée sur un protocole sans fil.
Le « persona » de l’assistant intelligent
« Persona » est un terme latin employé pour désigner une représentation fictive. Dans ce contexte, il s’agit de ce que doit représenter l’assistant personnel intelligent. En effet, le ‘Persona’ de l’assistant améliore l’expérience utilisateur en facilitant son interaction vocale avec sa machine. La personnalité d’un assistant vocal se définit à travers les éléments suivants :
- L’identité : il suffit de répondre à la question qui parle ? L’âge, le sexe etc.
- Les caractéristiques verbales : le ton, la voix, le vocabulaire.
- Le nom et l’avatar de l’assistant : ces deux éléments permettent à l’utilisateur de visualiser votre assistant intelligent par voie de conséquence ils garantissent une UX satisfaisante.
Les fonctions d’un assistant vocal
Un assistant vocal doit satisfaire les demandes de son utilisateur. D’abord, il donne la possibilité d’effectuer des recherches. Quand l’utilisateur pose une question, l’assistant intelligent doit trouver la réponse en cherchant dans sa base de connaissance. Ensuite, il doit exécuter les ordres de son utilisateur par exemple ; l’envoi d’un message, l’appel d’un numéro, la réponse à une question précise etc. Grâce à l’analyse des mots clefs, il peut reconnaître les ordres. Ainsi, il renvoie la demande de l’utilisateur à un autre serveur pour qu’il puisse traiter sa demande.
Exemples d’assistants intelligents
Les assistants vocaux les plus connus sont :
- Siri : existe depuis 2011. C’est un assistant intelligent développé par Apple. Il est disponible dans tous ses appareils : iPhone, iPad, i Watch etc. Siri peut exécuter plusieurs requêtes. Il est capable d’effectuer plusieurs actions tels que la traduction, le calcul et le renseignement. Il peut envoyer des messages, chercher des photos dans la galerie, mieux encore, il programme vos tâches du quotidien.
- Alexa : apparue en 2014 par Amazon. Il s’agit d’une assistante personnelle. Elle est devenue très célèbre auprès des utilisateurs grâce aux enceintes connectées « Echo » d’Amazon. A travers ses commandes, elle peut répondre à vos interrogations, lire des fichiers audios, programmer des alarmes… Elle peut aussi contrôler les appareils ménagers intelligents comme les thermostats et les micro-ondes. Alexa est disponible en anglais, en français, en allemand et en japonais.
- L’assistant google « Google Assistant » : créé en 2016; grâce à l’intelligence artificielle (AI; il permet d’effectuer plusieurs tâches à l’instar de : Répondre à des questions sur la localisation et la météo, le divertissement grâce à ses histoires et devinettes, l’obtention de plusieurs informations comme les horaires des avions et des trains ou bien l’état du trafic.
Cortana : depuis 2014. Créée par Microsoft, elle est une assistante de productivité personnelle. Il suffit d’activer le mode « Hey Cortana » pour pouvoir bénéficier de ses services. Elle s’occupe de la gestion de votre agenda et vous donne des informations sur votre planning, cherche des informations et des définitions et peut ouvrir des applications sur votre ordinateur.
Des astuces pour réussir la « Voice UX Design »
Comme l’UX design « User Experience Design » veut dire l’expérience vécue par un utilisateur lors de l’utilisation d’une interface, la Voice UX design signifie ‘’ l’expérience utilisateur vécue face à l’utilisation d’une interface vocale ‘’.
Une interface vocale efficace, doit respecter l’UX c’est-à-dire l’« User expérience ». L’expérience d’un client, lors de l’interaction avec l’assistant intelligent, doit être bonne et satisfaisante. Une bonne interface vocale doit obéir à plusieurs critères.
Cibler les demandes des utilisateurs
Il faut connaître les besoins de l’utilisateur. Posez la question suivante : « quelles sont les attentes des utilisateurs qui vont utiliser mon interface vocale ? ». Votre VUI doit :
- Chercher à accomplir ses demandes
- Choisir les expressions et les termes selon ses besoins
Travailler le « tone of Voice »
Le « tone of Voice », aussi appelé ton de la voix, est le ton utilisé par une entreprise dans le but de communiquer avec ses utilisateurs. Cette tonalité définit l’identité verbale de l’assistant intelligent. Il doit inclure :
- La fonction de l’assistant vocal : ses objectifs, ses actions, les caractéristiques de sa personnalité
- La façon de parler : la manière de s’adresser à son récepteur par exemple le tutoiement ou le vouvoiement. Le choix de son lexique et de son vocabulaire …
- La voix : définir le ton et le style de la voix par exemple : ton sérieux et formel, ton informel et comique …
Déterminer la voix
Il s’agit d’une étape très importante dans l’élaboration de votre interface utilisateur vocale. Vous pouvez choisir l’une de ces deux options :
- La voix d’un acteur humain : la voix d’un être humain enregistrée est réaliste. Elle offre la possibilité de varier les intonations mais elle est coûteuse et plus difficile à gérer. Sa conception est délicate puisqu’elle ne dépend pas de la technique « Text to speech ».
La voix synthétisée : par opposition à la voix des acteurs, elles sont plus faciles à modifier puisqu’elles sont basées sur la technique de TTS. En revanche, elles sont robotiques. En d’autres termes, elles sont moins expressives que les voix humaines
Etudier les cas d’usage
Le cas d’usage, en anglais « use-case » permet de décrire les fonctions proposées par un logiciel. Le listage des cas d’usages permet de définir la manière d’utiliser votre interface utilisateur vocale. Mais il faut faire attention, la liste des « use-cases » ne doit pas être exhaustive. Les cas rares sont à éviter. De toute façon, il est impossible de répondre à toutes les demandes d’utilisateur. Il est préférable de privilégier les demandes les plus fréquentes.
Écrire les dialogues
Il s’agit de la phase de la rédaction. Vous devez rédiger les échanges possibles entre votre assistant vocal et l’utilisateur. Il faut prévoir les requêtes des clients pour pouvoir donner des réponses. Il est fortement conseillé d’intégrer certains composants conversationnels afin d’humaniser la IUV par exemple :
- Les messages de confirmation et de remerciement : « Merci », « C’est noté », « D’accord », « avec plaisir », « bien reçu » etc. Ces messages aident l’utilisateur à savoir si son assistant intelligent a bien compris ses requêtes.
La maîtrise des erreurs : Quand l’assistant intelligent ne comprend pas les requêtes d’un utilisateur, l’expérience de celui-ci risque d’être mauvaise. C’est pourquoi il faut bien gérer ces erreurs. Vous pouvez par exemple proposer des réponses alternatives. Une fois la rédaction de votre dialogue est achevée, n’oubliez pas de passer à l’étape de « Text to Speech »
Tester et perfectionner
La dernière étape pour savoir si vous avez bien réussi votre « Voice UX design » est de faire des tests. Vous pouvez utiliser certains outils comme « Testapic ». La phase test doit confirmer les éléments suivants :
- Les réponses de l’assistant intelligent sont adéquates et claires.
- Les dialogues sont pertinents et cohérents.
- La voix et la personnalité de votre assistant garantissent une bonne Voice UX.
Mot de la fin
L’interface utilisateur vocale a révolutionné l’interaction homme machine. Grâce aux assistants vocaux, l’homme peut contrôler ses appareils, oralement. L’intelligence artificielle permet d’améliorer l’expérience des clients qui utilisent l’interface vocale. L’imitation de l’intelligence humaine rend les VUI plus faciles à contrôler. Pour garantir aux utilisateurs une bonne expérience, lors de l’échange avec l’assistant intelligent, il suffit de mettre en place une bonne stratégie de Voice UX Design. L’objectif est de satisfaire les attentes des utilisateurs. C’est pourquoi l’assistant vocal doit répondre à des caractéristiques bien déterminées.