Corrélation n'est pas causalité

Par   Partagez : Envoyer le lien de cet article par e-mail   

Les débusqueurs de théories comportementales

Les corrélations cachées

Chercher des corrélations et en tirer de grandes théories stupéfiantes semble devenir un sport particulièrement prisé chez les fans du "profiling" client. Les outils sont là. Nos moindres traces sont captées et enregistrées au sein de data warehouses toujours plus avides d'informations.

Corrélation et data mining

Les outils d'analyses statistiques et autre data mining sont prêts à débusquer les corrélations dissimulées dans la masse de données. Toutes les conditions sont disponibles pour élaborer une théorie des plus décoiffantes. Plus elle est invraisemblable, plus elle sera séduisante. Le passage de la corrélation acrobatique à la chaîne de causalité n'est plus qu'une formalité...

Cas concret, les courses du samedi...

Le contexte : une grande surface.
Quelques observateurs perspicaces ont remarqué que le samedi après-midi, il y a plus de mômes braillards dans les rayons qu'un jour en semaine. Et surprise ! le chiffre d'affaires augmente !
Aurait-on mis le doigt sur un nouveau lien caché ?
Ne serions-nous pas face à une relation de cause à effet informelle, une nouvelle théorie comportementale ?

Les spécialistes de l'analyse ne manqueront pas de nous expliquer le phénomène : le samedi après-midi, c'est congé et jour des courses, il y a plus de monde en magasin, plus d'enfants aussi, ils pleurent, les parents s'excitent et remplissent le chariot sans réfléchir...

Voilà une nouvelle chaîne de cause à effet identifiée. Les équipes de marketing n'ont plus qu'à plancher dessus...
Ne rigolez pas, j'en ai entendu de plus alambiquées que celle-ci mais, par pure déontologie, je ne les dévoilerai pas ici.

En complément

Dans le même genre, si vous ne connaissez pas l'étroite corrélation entre les ventes de crèmes glacées sur les plages de Californie l'été et la multiplication des attaques de requins, on en parle ici h1Ice Cream Consumption Linked to Shark Attacks. Voir aussi le cas exposé par le magazine en ligne de la BBC.

Profiling et analyse prédictive

Il est bien évident que pour réaliser une analyse prédictive suffisamment pertinente pour que l'on puisse se passer du lien de causalité en anticipant les comportements, il est indispensable de disposer d'une quantité de données conséquentes et des moyens d'analyses appropriés. L'établissement de "patterns" fiables pour le profiling, impose une puissance de calcul qui n'est pas (encore) à la portée du premier venu. On suivra de près les travaux autour du Big data et la gestion des grands volumes de données, Map-reduce, Hadoop et du cloud computing.



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 165)

Commentaires lecteurs...

Pour commenter en tant qu'Anonyme, cliquez sur "Commencez la discussion" Puis sur "Nom", tout en bas apparaît alors une case à cocher : "Je préfère publier en tant qu'invité"

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2017 Tous droits réservés Mentions légales


Management de l'entreprise
  Suivez-nous :   Google+   twitter+  Facebook  Linkedin    e-mail  
»» Toutes les fiches Piloter.org »»