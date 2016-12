Agrégat de données et perte de sens

Si l'on pense que le calcul de la moyenne est la meilleure façon d'extraire l'information, alors tous les zèbres sont gris.

Le calcul de la moyenne

L

Reporting et perte d'informations

e calcul de la moyenne n'est pas la meilleure manière d'extraire l'information d'une masse de données de même nature en apparence. Par principe, le calcul de la moyenne efface les disparités et étouffe ainsi les signaux faibles.Les organisations empilant les reportings pour remonter une soi-disante information synthétique, qui n'est en fait qu'agrégée, font disparaître à tout jamais toute la finesse, la subtilité et le sens de l'information. Ce sont justement les détails, les écarts à la norme et les accidents qui sont porteurs de sens. Ce sont justement ceux-là que l'on élimine à coups de "lissages" systématiques répétés.

C'est un peu comme ce projet qui voulait comparer le niveau de vie des salariés des grandes entreprises françaises en moyennant l'ensemble des salaires. Il n'a pas émergé, il était absurde.

Quel sens peut bien porter une telle information mélangeant les revenus astronomiques des hauts dirigeants et leur stocks options, celui de l'hôtesse d'accueil en contrat précaire et la bien peu substantiel prime accordée à l'éternel stagiaire en marketing après ses 6 mois de bons et loyaux services ?

Aucun, effectivement.

Comme dit le dicton, "Si l'on voue un culte au calcul de la moyenne alors il faudra admettre que tous les zèbres sont gris".

Attention, lors des agrégats de remontée d'informations de ne pas voir que des zèbres gris.

Une anecdote

Alors que j’intervenais dans une entreprise industrielle, les salariés du site m’avaient rapporté le fait suivant...Quelques semaines auparavant la direction générale du groupe était en visite sur le site pour présenter la nouvelle présidente, fille du précédent. La nouvelle présidente avait décider de s’approcher du « petit peuple » en partageant le repas de la cantine pompeusement dénommée « restaurant d’entreprise ».

Elle venait juste de prendre place avec son équipe lorsque l’un des derniers embauchés s’est dressé sur sa chaise et a déclamé à la cantonade « dommage qu’un statisticien ne soit parmi nous, il aurait noté une amélioration subite, significative et généralisé du salaire moyen de tous les petits employés que nous sommes… » (Il était vraisemblablement inspiré par la plaisanterie d’économistes imaginant Bill Gates entrer dans un bar pour prendre un café et tous les consommateurs sont instantanément devenu milliardaires… si on se fit au calcul de revenu moyen). La présidente et les membres de la direction de l’entreprise n’ont pas eu l’air d’apprécier cette juste application de la notion de « moyenne ».

Ensuite, au cours de la réunion générale qui suivi le déjeuner, la nouvelle présidente a un peu manqué d’à-propos en mentionnant maladroitement l’incident. Elle s’est lancée dans une justification de son salaire particulièrement élevé en évoquant le poids et les risques de sa charge avec les doutes sur un avenir incertain. Silence pesant. L’entreprise étant située dans une zone où le chômage sévit à plus de 20%, c’est au quotidien que les salariés vivent le poids et les risques avec un doute permanent sur leur avenir.

La médiane

Pour bien des mesures, la "médiane" qui marque la juste frontière dans une distibution entre les 50% au-dessous et les 50% au-dessus, est bien plus significative que la traditionnelle "moyenne". L'exemple typique de la distribution des salaires dans la société ou plus spécifiquement dans une entreprise donnée permet à tout un chacun de se repérer... Plus aisément encore lorsque l'on propose un classement par décile, de 10% en 10%.

Ce texte fait suite à l' Erreur nº1 Effet d'hysteresis et le modèle automobile.

