Big Data et Data Science : parler à l’individu plutôt qu’au segment

Le digital ouvre un potentiel énorme de ciblage et d’acquisition de nouveaux clients. Nous allons voir dans ce billet (extrait de ma thèse) une approche de stratégie de conquête, s’appuyant sur la data science.  C’est à proprement parler la démarche « big data », qui part du principe que les données sont incertaines, et imprécises. « Le monde du big data, c’est lorsque la donnée qui nous arrive est incertaine. Elle vient de quelqu’un qui l’a interprétée d’une façon qui est différente de la mienne » (Jean-Pierre Malle, M8, interview du 25/09/2014).  Merci à Jean-Pierre Malle pour l’entretien très riche du 25 septembre 2014.

data science tags

 

Le temps réel, 56 milli-secondes : place à l’algorithme!

Aujourd’hui, les marques doivent traiter un nombre infini d’informations, dans un temps fini, voire en temps réel. Le temps réel peut se définir par un laps de temps de 56 millisecondes (selon J.L. Bernard, président de Netwave, conférence EBG, 11-12 février 2014) : c’est le temps de l’envoi d’un web-service jusqu’à l’envoi de l’interaction correspondante. Pour cela, il faut laisser la place à la technologie, à l’algorithme, bref à la machine. L’humain ne peut plus traiter toutes les données en temps réel.

Le postulat du « big data » est de « considérer que chaque individu est à toucher par des moyens différents. Il ne faut pas essayer de faire des catégories (…) Je vais prendre en compte des données individuelles, et je vais trouver ce qui les différencie des autres. Alors que le data mining, c’est l’inverse : c’est analyser ce qui rassemble les gens » (Jean-Pierre Malle, M8, interview du 25/09/2014). Une approche « big data » va donc chercher les critères différenciant un individu d’un autre individu, et non ce qui peut les rassembler. Etant donné le nombre de données à disposition, seule une machine peut effectuer cela.

 

Comment identifier un individu de façon unique sur le web?

Au-delà du cookie, diverses clés d’identification existent, et c’est du croisement de plusieurs de ces clés que naît l’identification unique d’un client ou d’un prospect :

  • L’email (il existe plusieurs adresses email pour un même individu)
  • L’ID client (par exemple le numéro d’identification sur une commande)
  • Le cookie ID
  • Le fingerprint (l’ordinateur est une empreinte digitale i.e. paramètres systèmes, navigateur, langue clavier, langue de l’explorateur)
  • L’identifiant de connexion, requis pour se logger aux réseaux sociaux ou aux systèmes d’exploitation (ID Google, ID de connexion aux réseaux sociaux), voire l’ID des constructeurs (Apple, Samsung, …) permet d’identifier exactement un utilisateur quel que soit l’appareil, mobile, ou non

En collectant des millions d’évènements (ou signaux) enregistrés en temps réel sur un internaute, il est possible de savoir par exemple qu’un individu consulte certains sites plus que d’autres, ses heures et jours favoris de consultation, etc. Un seul signal n’a pas de pertinence : quand il est associé à des centaines d’autres signaux, il devient intéressant. La coexistence des (milliers de) signaux devient la signature d’une situation particulière ou d’un profil particulier.

 

Analyse situationnelle : la machine intelligente peut parler à l’individu

On parle également d’analyse situationnelle : il faut donc connaître la situation de l’individu au global, en reliant le comportement d’un individu à un enchaînement cognitif (tout ce qui induit son comportement). La machine est paramétrée à partir de schèmes cognitifs de l’individu, et réalise cette analyse situationnelle, apprend et s’adapte : « Il faut laisser la main à la machine : la machine reçoit tout type de données au fur-et-à-mesure, les « traite », en tire des connaissances. Si elle a les mécanismes cognitifs identiques à un individu, elle va faire pareil qu’un individu, elle va apprendre. » (Jean-Pierre Malle, M8, interview du 25/09/2014).

Ayant traité et compris la situation de l’internaute au niveau individuel grâce à l’algorithme, la marque va alors être en mesure de lui parler de façon personnalisée, en « one-to-one ». C’est bien a posteriori que les groupes d’individus sont constitués, grâce à l’algorithme, et pas a priori. Et cette analyse situationnelle garantit une nette amélioration de la performance. Par quel mécanisme ? Comment conquérir de nouveaux prospects par ce biais-là ? « On regarde le taux de succès : par exemple, s’il y a 20% des gens qui achètent réellement. Après on se dit, dans ces 20%, par rapport au segment que j’ai défini (ndlr : dans une approche statistique), ça paraît correct…. Mais, quid des 80% qui n’ont pas acheté ? Pourquoi ? Chacun pour des raisons différentes. C’est pour ça qu’en prenant un système de segmentation en amont, on élimine ces 80%. Alors qu’en les traitant jusqu’au bout, on va voir qu’il y a des différences : le taux de succès sera bien supérieur à 20%. C’est la technique employée par Netwave : il produit une amélioration de 15-20% sur les ventes sur les sites e-commerce. Pourquoi ? Parce qu’on s’intéresse à ceux qui n’achètent pas. » (Jean-Pierre Malle, M8, interview du 25/09/2014).

 

L’individu n’est pas que digital : intégrer les données offline

Cette démarche « big data » d’analyse situationnelle n’a pas besoin de données exclusivement digitales pour fonctionner : des données « offline » peuvent également être combinées à des données « online », et efficacement utilisées par les concessionnaires pour pouvoir parler de façon personnalisée au client. « J’ai fait une expérimentation en utilisant l’un de mes processeurs en le connectant à des sites d’un importateur de marque d’Asie du sud-est. On a capté des informations sur le site en fonction des visiteurs, qui sont anonymes, et là pour autant, on pouvait les rapprocher de visites qui avaient lieu dans certaines concessions. Il y avait une vingtaine de points de vente. Concrètement on enregistre les visites sur le site internet, on en tire des informations situationnelles dans une fiche de visite. Le vendeur dispose d’une tablette et commence à indiquer le modèle, des caractéristiques fournies par le client, si le système reconnait une ou deux fiches de visite, il propose au vendeur des options et des arguments en phase avec les intérêts exprimés sur ces fiches. Au fur et à mesure, le rapprochement se fait. Par la plateforme, on fait de l’analyse de situation des individus, et on se dit, a priori, cette personne va venir dans cette affaire-là, et il va venir à peu près à cette période-là, vu ce que font les autres… quand il arrive, le vendeur a déjà des fiches devant lui sur ce modèle-là. Avec les informations glanées dans la boutique et celles présentes sur le site, on peut identifier la personne individuellement. » (Jean-Pierre Malle, M8, interview du 25/09/2014).

L’exploitation combinée des données digitales (surf sur les sites), aux données « offline » (données des clients dans les affaires), peut donc s’avérer particulièrement utile dans le secteur automobile, où la concession est encore un incontournable pour acheter son véhicule. Si on a su parler de façon personnalisée à un client sur le net, et que le vendeur automobile lui adresse un message cohérent en concession, une grande partie du chemin de conquête d’un nouveau client est réalisé.

 

Data science vs. Data mining

Les algorithmes, qu’ils soient conçus dans une logique décisionnelle (data mining) ou situationnelle (data science), viennent en appui de toute réflexion stratégique. Les premiers partent de données passées pour comprendre le présent (analyse et action en temps réel), et anticiper le futur. Mais les résultats échappent souvent aux hypothèses statistiques et marketing de départ. Aussi, l’analyse situationnelle peut prendre le relai, en s’adaptant en temps réel à la situation de chaque individu : les data scientists ne cherchent pas à expliquer le passé, mais ils fonctionnent dans le présent, pour prédire des situations à venir (préférences, actes d’achat). La condition de réussite de l’une ou l’autre des deux approches est le « test and learn » : une méthode « auto-apprenante » et agile.