mardi 13 décembre 2016

Primaire de la gauche

Primaire de gauche, beaucoup de candidats, trop de candidats? Suivons seulement cinq d'entre eux:


La première des choses est l'extraction des données émises par ces candidats et celles les mentionnant pour ensuite les classifier, les mesurer, les analyser.

Première lecture: un indicateur consolidé par candidat sans différencier les thèmes de campagne. Un indicateur qui nous parle de volumétrie, de notoriété qui se calcule en combinant le nombre de mentions ainsi que leur audience ou impact: Il s'agit de l'Indicateur de Perception Objective:


 C'est une information mais basique, nous pouvons la nuancer en segmentant par thèmes. Pour l'exercice, nous avons choisi 8 thèmes:

  • Éducation
  • Santé
  • Finance / économie
  • Sécurité
  • Europe
  • Immigration
  • Écologie
  • Général (pour n'importe quel contenu)

Nous obtenons ainsi le graphique suivant, plus riche et qui permet d'y voir plus clair:


Nous voyons en effet qu'alors que dans le premier graphique Manuel Valls n'était pas en tête, il l'est selon le thème général. Cela veut dire qu'en général on parle plus et avec plus d'impact de Manuel Valls, mais si on segmente par certains thèmes, ce qui revient à diminuer le poids des généralités, alors d'autres candidats pointent devant.


Donc nous savons de qui on parle le plus et avec le plus de poids, et cela par thèmes. Mais en France il est important d'aller plus loin et de savoir avec quelle tonalité on en parle. En effet, il est des pays où seul le volume importe (nous avions par exemple fait d'excellentes prédictions en 2014 pour les élections du Brésil uniquement en nous basant sur le charisme, c'est à dire sur la perception objective).
En France, donc, il convient d'étudier le sentiment aussi. Nous avons également un indicateur de sentiment:


Nous disposons également de cet indicateur de sentiment pour chaque thème analysé. Ce qui nous permet de voir que si globalement le sentiment de Manuel Valls ou de Vincent Peillon est négatif, ce n'est pas le cas pour tous les thèmes. Vincent Peillon est très critiqué par exemple, ce qui le plombe, sur ce qui touche à l'Europe (il est vrai que son surnom de "Jackpot" ne l'aide pas beaucoup...).

Une fois que nous avons nos indicateurs de perception objective d'un côté et de sentiment de l'autre, il devient intéressant de les combiner pour avoir un indicateur global: l’indicateur postanalytics IPS: Indicateur de Perception Sociale.  En effet, avoir un sentiment très positif peut sembler une bonne chose mais si le volume est faible, cela ne suffit pas, comme à l'inverse compter sur une très forte notoriété mais négative.


Nous pouvons observer sur le graphique ci-dessus que Benoit Hamon semble bénéficier d'une très bonne perception sociale. Nous ne l'aborderons pas ici, mais il ne serait pas inutile d'aller encore plus loin et d'analyser la part réelle (ou externe) et la part artificielle car le candidat Hamon a une grosse équipe derrière lui... Nous pouvons également segmenter l'information pour mesurer ces deux parts et ainsi obtenir des indicateurs encore plus fiables pour faire des prédictions précises. Nous pouvons tout de même dire également que Benoit Hamon est surtout épargné par les grands médias qui ne le critiquent pas autant qu'ils le pourraient.

Voyons maintenant quelques influencers, et comment ils relayent l'information (ou l'ignorent parfois):

Le graphique ci-dessus nous montre avec quel sentiment ces influencers parlent des candidats sur le réseau twitter. Nous observerons que Manuel Valls est ignoré du compte twitter de France 2, de Libé ou Mediapart par exemple.

Ce qui apparaît également de façons très claire  est la faiblesse de Sylvia Pinel. Il faut dire qu'elle même ne parle à peine de sa "campagne".

Nous pouvons ensuite étudier le langage employé. Les nuages de mots sont très pratiques pour cet exercice car ils permettent une visualisation immédiate. Pour l'exemple, nous avons isolé les verbatims qui mentionnent Manuel Valls et cela de façon négative:


 Nous voyons ainsi sur quoi est critiqué ou attaqué Manuel Valls.
Avec d'autres nuages de mots nous pourrions ainsi analyser les critiques des autres candidats et nous pourrions également obtenir les nuages de mots de ce qui est positif...

Enfin, le plus important n'est pas de faire une photo, mais de pouvoir observer l'évolution dans le temps. Postanalytics permet de visualiser cette évolution grâce à des graphiques où l'on peut voir toutes les courbes que dessinent les indicateurs.

vendredi 25 novembre 2016

Tisséo, transport en commun Toulouse Métropole

TisséoLe réseau des transports en commun de l'agglomération toulousaine que tout le monde connait à Toulouse pour le bus, le métro ou le tram, est un acteur régional de premier plan que nous nous devions d'analyser.
Toulouse est une métropole dont la population augmente fortement et les projets liés au transport sont donc nombreux:

  • Rallongement de lignes existantes
  • Rallongement des rames de métro de laligne A
  • 3ème ligne de métro
  • Téléphérique
  • Nouveaux bus
  • Tram
  • Extension des horaires du service du metro (la nuit)
  • Intermodalité
  • etc
Le sujet est donc très largement abordé et non seulement par les usagers! Mais que se dit-il?
Voici un accès à un canal postanalytics dédié à Tisséo. Les clés d'accès sont:
  • mail:  tisseo@postanalytics.fr
  • mot de passe: tisseo
Un service d'alertes permet de consulter ces alertes, d'en extraire des statistiques, des indicateurs consolidés, des nuages de mots etc:


Il est également intéressant de savoir qui a le plus d'impact et avec quel sentiment et quelle fréquence d'expression. Qui sont les plus grands détracteurs et les plus grands "fans", quels mots emploient les uns et les autres?


Nous voyons ci-dessus par exemple les dix plus négatifs sur twitter pendant novembre 2016. On observe que les plus négatifs (les plus rouges) sont aussi ceux qui ont le plus faible impact.

Et quels mots utilisent ces détracteurs?
Il semble que ce qui est le plus critiqué soit le Métro puis ensuite le Bus et que le Tram soit épargné.

Les indicateurs fournis par postanalytics prmettraient d'en savoir beaucoup plus:
  • quantifier le sentiment de manière détaillée (non seulement par modalité mais encore par critères précis comme par exemple: securité, prix, couverture, retards, etc)
  • évolution dans le temps