Les assistants vocaux commencent à envahir nos vies mais leurs capacités sont encore limitées et le plus souvent décevantes. Cependant, ils laissent apercevoir une réalité atteignable dans le futur proche, digne de scénarios de sciences fictions, et redéfinissent ainsi notre rapport à la technologie, et à l’humain. Nathan Charpentier, étudiant MBA MCI PT 18 s’interroge sur leur futur, au vu d’événements récents. 

Comme le soutient Tom Wolfe de manière assez provocante dans son dernier livre The Kingdom of Speech, le langage, et son origine, est encore loin d’avoir recelé tous ses mystères.
Or, nous nous trouvons à un tournant historique en voulant transmettre à des machines, par le biais de l’assistant vocal, ce qui a été jusqu’à maintenant le propre de l’humain : le langage.

Dans cette folle course à la maitrise du langage, Google et Amazon caracolent en tête et possèdent chacun un avantage décisif : pour Amazon, c’est l’e-commerce, l’accès direct à son catalogue de vente ; pour Google, c’est les données utilisateurs et l’utilisation de la voice search depuis une décennie.

Un autre avantage considérable pour Google est son système d’opération Androïd, qui lui donne accès à une part importante du marché du smartphone, ainsi que ses smartphones Pixels (malgrè des ventes peu convaincantes).

Enfin, ce qui démarque ces deux géants, c’est principalement l’art d’avoir réussi à convaincre grâce à leur discours et leurs offres, que la collecte de vos données, et son utilisation couplée à des enceintes connectées écoutant constamment l’audio ambiant n’est pas de la surveillance.

Pour Google ce n’est qu’un prémice à The Age of Assistance qui s’inscrit dans un discours rassurant présentant l’utilisation de données comme une aide, et éloigne la notion inquiétante d’une connaissance client tellement poussée qu’elle ressemble à si méprendre à de la surveillance.

Pour Amazon, cette logique va encore plus loin avec le lancement de caméras connectées pour compléter son écosystème domotique (même si de manière plus large, l’intégration d’un assistant dans certaines pièces et son interaction avec certains objets connectés comporte un autre niveau de problèmes à prendre en compte).

Avec cette démarche, les deux précurseurs ont déjà devancé les géants de la tech. Samsung avec Bixby, Microsoft avec Cortana, Apple et Siri, tous ont créé un assistant vocal ou un chatbot. En fait, une interface permettant à leur IA d’interagir avec l’Homme et de l’intégrer dans un écosystème digital arrivé à maturité.

Il existe maintenant trois choix pour les entreprises, soit intégrer les deux assistants, comme a choisi Whirpool en laissant la possibilité à l’utilisateur d’installer son assistant préféré lors du setup, soit de s’associer à un assistant, ou encore de créer son propre assistant.

Cependant, nous sommes encore à l’an 1 des assistants. Malgré des avancées considérables en matière de Natural Language Processing, nous découvrons les limites des assistants dès que nous sortons des tâches principales qui leurs ont été attribuées, ou si les nuances contenues dans notre requêtes deviennent trop complexes. Ou encore, quand elles cessent tout simplement de fonctionner, même lors de démo cruciales comme l’a montré la dernière démo de LG lors du CES 2018.

La capacité de compréhension de l’IA a considérablement augmenté. Source: AI Index 

Un autre aspect important des assistants vocaux est le manque de côté humain de cette nouvelle technologie. Si beaucoup d’early adopters (et j’en fais partie) s’extasient devant les possibilités offertes par ces technologies (parler à des machines !), la réalité est un tant soit peu plus nuancée.

Tout comme les téléphones ont transformé notre espace privé et l’espace public, les assistants vocaux transformeront sans doute notre savoir-être dans l’espace public et privé. C’est déjà le cas pour les personnes s’appelant Alexa aux Etats-Unis et en Grande-Bretagne, et certains annonceurs comme Netatmo prennent la décision de faire vivre directement leur assistant avec un chatbot, pour laisser le choix aux utilisateurs de communiquer de manière discrète avec leur objets connectés.

On peut également se demander quelle influence sur le langage, qui représente des siècles d’évolution de codes et de règles servant à réguler notre rapport à l’autre, risque d’évoluer si nous parlons à des machines ayant une voix humaine, uniquement dans le domaine de l’impératif et sans faire preuve d’une politesse qui n’est pas nécessaire pour atteindre notre but lorsque nous parlons à une machine.