La Reconnaissance Visuelle est la technologie la plus mature des domaines d’application de l’intelligence artificielle, il s’agit d’une formidable opportunité pour le e-commerce. Mener une recherche par l’image pour trouver un produit est un moyen intuitif et précis qui se démocratise. Je vous propose d’aller à la rencontre d’un entrepreneur,  Julien Capra, cofondateur de la société Watiz. Présente au Consumer Electronic Show 2020 l’ambition de la startup est claire: « révolutionner les comportements d’achat vestimentaire » ! Vous verrez et entendrez Julien nous présenter sa solution de reconnaissance visuelle pour le e-commerce dans une vidéo à la fin de cet article.

 

watiz: nouvelle solution de shopping par l'image

La solution Watiz: un assistant e-commerce efficace et rapide pour votre shopping vestimentaire

La technologie de Watiz transforme les téléphones en capteurs intelligents: « nous développons une suite applicative de moteurs de recherche par l’image ». Julien et son associé Rémy Villecroze ont crée le Shazam de la mode.

Dans la vie de tous les jours, si  vous voyez un individu qui porte un vêtement qui vous plait il vous suffira de le prendre en photo, vous serez immédiatement mis en relation avec le site e-commerce qui dispose des articles référencés.

Reconnaissance visuelle et e-commerce feront-ils partie de nos prochaines habitudes de shopping ?

 

La 1ère solution grand public de Watiz s’appelle WATSTYLE, elle sera disponible au printemps 2020:

L’origine de la Start-up et de sa solution de reconnaissance visuelle pour l’e-commerce

 Les bonnes idées de business sont celles qui améliorent le quotidien à partir d’une problématique simple. Julien se remémore la naissance de Watiz: « on voulait trouver une alternative à la requête Google« . La démocratisation des algorithmes de reconnaissance visuelle comme Eigen Face a facilité l’opportunité de se tourner vers la prise de photo pour identifier un objet et l’afficher ensuite dans une application e-commerce. 

Watiz a développé sa propre technologie de moteur de recherche visuelle en se basant sur des composants à la fois « open source » (libres et partagés entre développeurs) et propriétaires en deep learning. « Watiz a réalisé un assemblage algorithmique permettant de localiser spatialement des vêtements dans un photo, de les décrire sous forme mathématique et de les comparer dans une base de données de vecteurs ».

  • Les ingrédients techniques nécessaires à une solution comme Watiz sont:
    1. L’intégration de dizaine de milliers d’images au « Datalake », le répertoire de données à partir duquel l’IA va réaliser sa sa modélisation et afficher des résultats.
    2. L’entraînement du réseau de neurones sous la forme de Deep Learning pour obtenir une réponse quasi-instantanée de l’application aux photos prises.

Aujourd’hui Watiz dispose de 100 partenaires -marques de vêtements, la société a pu acquérir un catalogue conséquent pour sa solution e-commerce. Les associés doivent néanmoins constamment incrémenter le volume de données pour que vous soyez certains de retrouver votre prochaine tenue de soirée et que leur solution e-commerce deviennent un succès ! L’intérêt de le reconnaissance visuelle pour le e-commerce est d’offrir à la fois un gain de temps et une pertinence supplémentaires dans les résultats obtenus pour les utilisateurs.

“On voulait trouver une solution plus rapide qu’une requête Google quand on ne connait pas un objet”.

« Le vêtement est certainement l’objet le plus difficile à faire reconnaître par un device: ça se plisse, ça se déforme et la luminosité n’est jamais la même ! »

julien capraJulien Capra, Your Content Goes Here

 

Comprendre le Deep Learning, technologie à l’origine de la puissance de la reconnaissance visuelle

                    Deep Learning et Machine Learning sont des formes d’Intelligence Artificielle:

  • Le Machine Learning ou « apprentissage automatique » est une forme d’IA, ce que l’on considère souvent comme miraculeux demande en réalité énormément de temps et d’entrainement et l’homme reste le moteur de cet apprentissage initial.
  • Au sein du Machine Learning plusieurs algorithmes peuvent être utilisés suivant les domaines visés. Le Deep Learning est le plus souvent choisi pour les formes de reconnaissance faciale comme vocale ou le traitement du langage. Le Deep Learning se distingue par l’utilisation de la méthode des réseaux de neurones née dans les années 5O grâce aux travaux de neurologues. Son exploitation actuelle pour automatiser la résolution de problèmes complexes date de 2010.
intelligence artificielle machine learning deep learning

 

La plupart des solutions actuelles utilisant l’IA sont des formes de Deep Learning. Son émergence a pu voir le jour grâce à l’explosion des capacités des ordinateurs et l’accumulation de données. Les détecteurs d’objets du quotidien ou le text to speech sont les résultats d’algorithmes qui utilisent les réseaux de neurones. Cette simplicité apparente explique son explosion dans les domaines marchands, parfois artistiques (création musicale) et les velléités financières d’acteurs économiques majeurs.

 

Les plus grands acteurs de la Tech investissent massivement dans la reconnaissance visuelle

  • En 2016, Microsoft a développé la technologie open-source Realtime Crowd Insights qui permet d’identifier le sexe, l’âge et même les émotions de chaque client en magasin grâce à la reconnaissance faciale, autant de précieuses infos pour adapter les offres produits aux consommateurs.
  • Google est certainement la société la plus convaincue par le potentiel de la reconnaissance visuelle dans son débouché commercial (notamment au travers de Google Lens qui reconnait + d’1 milliard de produits). En 2016 la firme américaine avait acheté Moodstocks pour sa technologie Overlay similaire à celle de Watiz . Depuis 2012 son réseau neuronal sait reconnaître la plupart des visages humains sur Youtube.
  • IBM n’est pas en reste avec Watson Visual Recognition qui permet d’identifier des scènes, des objets, des visages, des couleurs, des aliments, du texte et bien plus encore.
  • Snapchat a lancé « Visual Search » pour identifier un produit et l’acheter sur Amazon.
  • Pinterest a inclus une fonctionnalité de recherche visuelle pour décortiquer une photo et peaufiner sa recherche, la firme a également lancé avec Instagram des fonctionnalités similaires à l’association de Snapchat avec Amazon dans le projet cité ci-dessus.

Voici les projections de chiffre d’affaires de l’IA dans un horizon proche:

intelligence artificielle chiffre d'affaires horizon 2025

 

D’autres illustrations de l’application de l’IA au e-commerce:

Les champs des possibles de la reconnaissance visuelle dans l’e-commerce sont légions, voici quelques exemples d’origine française:

  • Dans l’alimentaire :
    • vous connaissez l’application aux 17 millions d’utilisateurs Yuka qui scanne vos produits (alimentaire – cosmétique) et analyse leur impact sur la santé. 
    • Avec Scan’Up ces 2 sociétés contribuent à un nouveau comportement: « Scanner pour bien manger ». La solution permet d’évaluer la transformation subie par le produit et, in fine, de pousser les industriels à améliorer leur chaîne de production.
    • Dans un style différent et toujours en utilisant la photo Foodvisor et son application détectent les aliments qui s’y trouvent, et évalue le nombre de calories : êtes-vous certain(e) de vouloir rajouter de la crème fraîche dans ces pâtes ?
  • Dans les médias:
    • les français de Selectionnist créent un pont entre le magazine à l’acte d’achat, du print vers le digital. 5 000 produits sont ajoutés tous les mois au catalogue pour être revendus.
    • A l’instar de M6 et sa chaine 6Play qui intègre une dimension de reconnaissance visuelle c’est l’ensemble des chaînes de télévision qui sont sur le point de proposer la même logique publicitaire où les éléments affichés à la télévision pourront être achetés via une interface commerçante.
  • Dans le tourisme ou la culture:
    • Smartsy vous offre, à partir d’une capture d’image, ou d’objet des informations comme l’histoire d’un bâtiment de Paris ou l’origine du logo Volswagen.

L’innovation provient aussi des acteurs de la Distribution qui ont investit le domaine depuis plusieurs mois:

  • Que ce soit en utilisant le code-barres pour avoir accès à des produits similaires sur la Marketplace de Rakuten (anciennement Prime Minister)
  • Ou en prenant une photo comme ce qu’offre aujourd’hui l’enseigne Conforama grâce à la technologie de la start-up israélienne « Syte’s InstaSearch ». 
  • La reconnaissance faciale est un enjeu assez fort actuellement, son application diffère suivant les pays. Alibaba a investit dans les sociétés Sense Time et Megvii pour rendre concret le paiement par reconnaissance faciale cette fois-ci….

Citons par ailleurs d’autres sociétés et domaines que la reconnaissance visuelle permet de faire évoluer rapidement:

  • L’automatisation des paiements (restauration collective, péages,…): Deepomatic  est l’un des acteurs en croissance
  • La sécurité (détection de bagages abandonnés, des biens et des personnes)
  • Le contrôle qualité des infrastructures ferroviaires,telco, btp, la maintenance préventive
  • La Santé: automatisation du traitement des images radiologiques pour la détection de cancers
  • Digital Out of Home: des sociétés comme Exterion Media ou JC Decaux peuvent aujourd’hui permettre aux annonceurs de cibler leurs messages suivant les populations qui empruntent le chemin du travail le matin et passent devant les panneaux publicitaires.

 

Julien Capra vous présente Watiz en vidéo:

Conclusion:

La reconnaissance visuelle est née bien avant les années 2000, elle représentait à l’époque un atout pour les enjeux de sécurité. Depuis sa progression exponentielle se fait dans de nombreux domaines et notamment le e-commerce. Cette évolution a vu le jour grâce à 2 principaux facteurs:

  1. l’accroissement de la puissance de calcul des ordinateurs
  2. l’accumulation des données nécessaires à l’apprentissage des IA

Aujourd’hui le succès d’une application telle que Watiz dépendra énormément de la fluidité du basculement entre les mondes Offline et OnLine et la qualité de l’UX  associée.

L’adoption de ce genre d’applications par les utilisateurs reste en-dessous des attendes pour le moment … Rappelons ici qu’Amazon a mis fin à son expérience « Amazon Spark« , son réseau social dédiée à faire vivre une nouvelle expérience de e-commerce. Difficile d’avouer cet échec pour la firme de Seattle, selon qui la solution a « pivoté » pour se centrer sur les produits de décoration…. De la même manière si vous utilisez la Google Lens je pense que vous resterez un peu sur votre faim. Plus les utilisateurs entreront de données et de requêtes plus le moteur sera fiable. Faire progresser les habitudes se fera lentement, nous déverrouillons désormais notre téléphone par reconnaissance faciale: je suis convaincu que nous allons vers un comportement d’achat de ce type très prochainement.

L’application Watiz se veut un complément de canaux habituels d’achats et une nouvelle source de revenus et d’anticipation des tendances pour les fabricants. L’assortiment dans le monde mode est absolument pléthorique, c’est la raison pour laquelle la stratégie de Watiz est de se tourner spécifiquement sur les lignes vestimentaires plus confidentielles à l’attention des fashionistas

Soutenez l’essor de cette solution en devenant beta-tester » et ainsi aider leur solution à devenir un nouveau geste du quotidien: rendez vous sur le site de Watiz.

 


Sources:


Pour les lecteurs les plus curieux voici quelques fournisseurs d’API qui s’intègrent dans des solutions de reconnaissance visuelle:


Pour Aller plus loin avec les articles du MBA MCI: