jeudi 11 septembre 2014

Information diluée, noyée dans le bruit

Le bruit est toute ces données inutiles qui parasite l'information qui est la plus intéressante. Il existe une information totalement neutre, qui délivre juste une nouvelle, sans analyse ni jugement de valeur. Puis il existe l'information qui reflète la perception sociale: l'opinion, la valorisation, la critique etc.
Malheureusement, le poids de l'information neutre écrase le second type d'information et celle-ci se dilue. Cette 'noyade' peut-être volontaire mais pas toujours. 

Prenons un exemple réel: nous avons analysé la perception sociale sur twitter de la ville de Valladolid en Espagne sur la période allant du 22 août au 10 septembre 2014:



Nous voyons parfaitement que le poids des données purement informatives neutralise le sentiment. Le sentiment varie plus ou moins entre -40 et +20, ce qui veut dire qu'il n'occupe que 30% de l'amplitude possible (de -100 à +100).

Il se trouve que durant cette période, le maire de la ville a prononcé quelques mots qui ont provoqué une crise très importante qui a largement dépassé les frontière du pays et même de l'Europe. Mais nous voyons également que cela ne se voit pas: Le raz de marée de commentaires sur les matchs de football, par exemple, gomment l'impact négatif des déclaration du maire!

Alors faisons l'exercice suivant: oublions tous les contenus "neutres" et regardons le nouveau résultat:


Comme c'est intéressant! Le sentiment varie maintenant, en gros, de -100 à +60 et nous avons donc une amplitude qui passe de 30 à 80%!
Les bonnes comme les mauvaises nouvelles se détachent clairement: la crise de réputation provoquée par le maire plombe le sentiment de manière durable sur la première moitié de la période analysée.

Sur la fin de la période, nous voyons un sentiment très positif qui s'installe, il s'explique par la semaine de fête de la ville qui fait tout oublier...

Rien de nouveau, le cirque romain savait déjà tout cela...
Sauf que maintenant avec des solutions comme postanalytics, on peut le quantifier.