jeudi 5 janvier 2017

le coût d'une boulette

Dans le cadre de la primaire de gauche, ce début de 2017 avait plutôt bien commencé pour Vincent Peillon... jusquà la boulette.
Peu importe les intentions, les maladresses, les excuses, une erreur de communication va être utilisée et surtout dans une campagne même primaire.

Pour rappel, Vincent Peillon s'est lancé dans une comparaison fort hasardeuse en parlant du régime de Vichy qu'il situe en plus aux alentours de 2017. Sur un sujet sur lequel on le disait "très raffiné", celui de la laïcité, il a dérapé, de façon odieuse pour certains. S'aventurer dans des parallèles entre étoiles jaunes et stigmatisation de musulmans.... Mais qu'allait-l faire dans cette galère?


La question qui nous intéresse ici est d'être capable de mesurer l'impact de la boulette. Quel prix va payer Vincent Peillon va-t-il payer pour cette erreur? Combien de temps cela va le "plomber"? Qui profite de la situation pour s'acharner contre lui et de quelle manière?

Nous n'allons pas ici répondre à toutes ces questions, car nous sommes encore à chaud d'abord et puis il s'agit d'un simple "apéritif" qui ne prétend pas dévoiler tous les éléments d'analyse dont nous disposons.

Voyons dans un premier temps l'évolution de l'indicateur de perception sociale de Vincent Peillon (en rouge) en comparaison avec d'autres candidats (en gris):


Il était à son sommet le 3 janvier, devant tous les autres candidats (Valls, Hamon, Montebourg et Pinel) puis il plonge dans le négatif le jour suivant, au plus mauvais moment car cette boulette annule sa progression.

Voyons maintenant qui sont les influencers de Vincent Peillon depuis le 4 janvier 2017, et cela de manière générale (sur tous les thèmes, tous types d'influencers confondus:


On remarquera qu' Europe 1 ignore complètement le sujet qui dérange et préfère parler uniquement des nouvelles positives qui concernent Vincent Peillon, sans même nuancer ce qui pourrait l'être comme le soutien de Mazarine Pingeot (dont le mari est conseiller du candidat).
Regardons ensuite le nuage de mots des influencers les plus négatifs:
Nous observons en effet les mots: vichy, musulmans, juifs, laïcité, étoile, jaune....
On voit aussi l'importante place de Manuel Valls, il est toujours présent quand on citrique Vincent Peillon!

Nous arrêtons ici ce modeste post, nous pourrions détailler tout cela par thématiques, faire la part des choses en séparant la polémique du reste, analyser les influencers par type (les média, les individus, les organisations,...) et surtout observer l'évolution dans les jours qui suivent...



mardi 13 décembre 2016

Primaire de la gauche

Primaire de gauche, beaucoup de candidats, trop de candidats? Suivons seulement cinq d'entre eux:


La première des choses est l'extraction des données émises par ces candidats et celles les mentionnant pour ensuite les classifier, les mesurer, les analyser.

Première lecture: un indicateur consolidé par candidat sans différencier les thèmes de campagne. Un indicateur qui nous parle de volumétrie, de notoriété qui se calcule en combinant le nombre de mentions ainsi que leur audience ou impact: Il s'agit de l'Indicateur de Perception Objective:


 C'est une information mais basique, nous pouvons la nuancer en segmentant par thèmes. Pour l'exercice, nous avons choisi 8 thèmes:

  • Éducation
  • Santé
  • Finance / économie
  • Sécurité
  • Europe
  • Immigration
  • Écologie
  • Général (pour n'importe quel contenu)

Nous obtenons ainsi le graphique suivant, plus riche et qui permet d'y voir plus clair:


Nous voyons en effet qu'alors que dans le premier graphique Manuel Valls n'était pas en tête, il l'est selon le thème général. Cela veut dire qu'en général on parle plus et avec plus d'impact de Manuel Valls, mais si on segmente par certains thèmes, ce qui revient à diminuer le poids des généralités, alors d'autres candidats pointent devant.


Donc nous savons de qui on parle le plus et avec le plus de poids, et cela par thèmes. Mais en France il est important d'aller plus loin et de savoir avec quelle tonalité on en parle. En effet, il est des pays où seul le volume importe (nous avions par exemple fait d'excellentes prédictions en 2014 pour les élections du Brésil uniquement en nous basant sur le charisme, c'est à dire sur la perception objective).
En France, donc, il convient d'étudier le sentiment aussi. Nous avons également un indicateur de sentiment:


Nous disposons également de cet indicateur de sentiment pour chaque thème analysé. Ce qui nous permet de voir que si globalement le sentiment de Manuel Valls ou de Vincent Peillon est négatif, ce n'est pas le cas pour tous les thèmes. Vincent Peillon est très critiqué par exemple, ce qui le plombe, sur ce qui touche à l'Europe (il est vrai que son surnom de "Jackpot" ne l'aide pas beaucoup...).

Une fois que nous avons nos indicateurs de perception objective d'un côté et de sentiment de l'autre, il devient intéressant de les combiner pour avoir un indicateur global: l’indicateur postanalytics IPS: Indicateur de Perception Sociale.  En effet, avoir un sentiment très positif peut sembler une bonne chose mais si le volume est faible, cela ne suffit pas, comme à l'inverse compter sur une très forte notoriété mais négative.


Nous pouvons observer sur le graphique ci-dessus que Benoit Hamon semble bénéficier d'une très bonne perception sociale. Nous ne l'aborderons pas ici, mais il ne serait pas inutile d'aller encore plus loin et d'analyser la part réelle (ou externe) et la part artificielle car le candidat Hamon a une grosse équipe derrière lui... Nous pouvons également segmenter l'information pour mesurer ces deux parts et ainsi obtenir des indicateurs encore plus fiables pour faire des prédictions précises. Nous pouvons tout de même dire également que Benoit Hamon est surtout épargné par les grands médias qui ne le critiquent pas autant qu'ils le pourraient.

Voyons maintenant quelques influencers, et comment ils relayent l'information (ou l'ignorent parfois):

Le graphique ci-dessus nous montre avec quel sentiment ces influencers parlent des candidats sur le réseau twitter. Nous observerons que Manuel Valls est ignoré du compte twitter de France 2, de Libé ou Mediapart par exemple.

Ce qui apparaît également de façons très claire  est la faiblesse de Sylvia Pinel. Il faut dire qu'elle même ne parle à peine de sa "campagne".

Nous pouvons ensuite étudier le langage employé. Les nuages de mots sont très pratiques pour cet exercice car ils permettent une visualisation immédiate. Pour l'exemple, nous avons isolé les verbatims qui mentionnent Manuel Valls et cela de façon négative:


 Nous voyons ainsi sur quoi est critiqué ou attaqué Manuel Valls.
Avec d'autres nuages de mots nous pourrions ainsi analyser les critiques des autres candidats et nous pourrions également obtenir les nuages de mots de ce qui est positif...

Enfin, le plus important n'est pas de faire une photo, mais de pouvoir observer l'évolution dans le temps. Postanalytics permet de visualiser cette évolution grâce à des graphiques où l'on peut voir toutes les courbes que dessinent les indicateurs.

vendredi 25 novembre 2016

Tisséo, transport en commun Toulouse Métropole

TisséoLe réseau des transports en commun de l'agglomération toulousaine que tout le monde connait à Toulouse pour le bus, le métro ou le tram, est un acteur régional de premier plan que nous nous devions d'analyser.
Toulouse est une métropole dont la population augmente fortement et les projets liés au transport sont donc nombreux:

  • Rallongement de lignes existantes
  • Rallongement des rames de métro de laligne A
  • 3ème ligne de métro
  • Téléphérique
  • Nouveaux bus
  • Tram
  • Extension des horaires du service du metro (la nuit)
  • Intermodalité
  • etc
Le sujet est donc très largement abordé et non seulement par les usagers! Mais que se dit-il?
Voici un accès à un canal postanalytics dédié à Tisséo. Les clés d'accès sont:
  • mail:  tisseo@postanalytics.fr
  • mot de passe: tisseo
Un service d'alertes permet de consulter ces alertes, d'en extraire des statistiques, des indicateurs consolidés, des nuages de mots etc:


Il est également intéressant de savoir qui a le plus d'impact et avec quel sentiment et quelle fréquence d'expression. Qui sont les plus grands détracteurs et les plus grands "fans", quels mots emploient les uns et les autres?


Nous voyons ci-dessus par exemple les dix plus négatifs sur twitter pendant novembre 2016. On observe que les plus négatifs (les plus rouges) sont aussi ceux qui ont le plus faible impact.

Et quels mots utilisent ces détracteurs?
Il semble que ce qui est le plus critiqué soit le Métro puis ensuite le Bus et que le Tram soit épargné.

Les indicateurs fournis par postanalytics prmettraient d'en savoir beaucoup plus:
  • quantifier le sentiment de manière détaillée (non seulement par modalité mais encore par critères précis comme par exemple: securité, prix, couverture, retards, etc)
  • évolution dans le temps

vendredi 11 décembre 2015

Elecciones España 2015 #20D

Encuestas, quinielas, sondeos (comprados o no), las previsiones del resultado de las elecciones #20D de 2015 en España no faltan y cada uno tiene una que le gusta más que otra. La cuestión es cómo transformar todas estas opiniones en Internet y Redes Sociales en información objetiva y explotarla para llegar a un conocimiento que aporte un valor estratégico.
No es nada fácil y lo primero es ser capaz de identificar los datos, que son millones, sin caer en varias trampas como por ejemplo tener en consideración opiniones falsas o compradas, bots, etc.

Primero necesitamos medir para poder objetivar y por eso usamos en postanalytics unos indicadores. Gracias a este modelo de indicadores, obtenemos un valor de lo que llamamos la percepción objetiva que representa una combinación del volumen de datos, de su relevancia y peso.
Hemos calculado el indicador de percepción objetiva para cada candidato y cada día.
Este estudio ha durado 8 semanas y hemos medido la percepción objetiva media general de cada candidato y la de Mariano Rajoy es la más alta.
Luego nos hemos centrado en la fuente Twitter y alli hemos segmentado los tweets en función de la neutralidad de sus autores. Cada autor es o neutro o militante (propio candidato, su equipo, su partido, cargos de su partido, etc). Así que cada tweet ha sido clasificado entre 3 posibles categorías:


 - Propio (un tweet de un militante mencionando a "su" candidato)
 - Exterior, ajeno (un tweet no militante)
 - Oposición (un tweet de un militante mencionando a otro candidato distinto del suyo)


Así hemos obtenido un indicador de percepción objetiva para candidato y además por categoría, lo que nos permite medir la contribución de los propios equipos y poner en evidencia el papel activo militante para poder aislarlo.
Vemos muy bien en la siguiente gráfica que si bien la percepción objetiva de Pablo Iglesias es alta, es debido en gran parte a la comunicación generada por su propio equipo (también cabe precisar que se han descartado los contenidos procedentes de Latina America):


Si bien es cierto que existe una correlación entre votos y exposición de los candidatos (por eso el tiempo de antena en televisión durante la campaña electoral se controla), hemos incluido un estudio del sentimiento para afinar nuestra simulación: es la tercera columna (de color verde) de la anterior gráfica. Eso nos dice que de Mariano Rajoy se habla mucho y que no es nada artificial o provocado por su equipo pero que se habla en general negativamente.

Con esos conceptos, considerando la percepción objetiva de cada candidato y descartando la generada por el mismo y aportando un factor corrector relacionado con la percepción social (es decir la percepción objetiva combinada con el sentimiento), hemos calculado una simulación de votos y presentamos a continuación su evolución semana a semana:


Según nuestras previsiones, Pablo Iglesias es el que realiza la mejor campaña pues conseguiría ganar votos con el tiempo que pasa. Mariano Rajoy en cambio acusa una baja muy sensible al finalizar el periodo, en gran parte criticado por su ausencia en debates.

Las diferencias permiten pronosticar cualquier resultado el día 20 y la campaña oficial será decisiva sin duda.

mardi 13 octobre 2015

Contribution politique

Mesurer la perception sociale des différents candidats d'une campagne électorale, les comparer entre elles, voire comment elles évoluent, extrapoler etc, c'est très bien.

Quels sont les pièges?

Le problème est identifier la partie représentative de la réalité et celle qui est artificielle.
Il y a des candidats qui mettent en place des équipes pour dynamiser leurs campagnes et cela s'apparente des fois à de l'astroturfing.

Nous pouvons voir par exemple lors des #Regionales2015 en #LRMP que la Team Saurel est très active:

Tous les candidats comptent sur leurs militants et leurs soutiens. Certains sont plus organisés que d'autres. Il est donc important d'identifier ces utilisateurs et de pouvoir isoler leur contribution.

Faisons la différence suivante, par exemple sur twitter:
- si le tweet a un rapport avec la campagne, on le met de côté comme tweet de "campagne" et avec son impact total et ses différents sentiments (un même tweet peut parler très bien d'un candidat et ridiculiser un autre)
- si le tweet provient de notre équipe de soutien, alors on le marque comme "Team"
- si le tweet est en fait un "scud" en provenance du camp adverse, on le marquera comme "TeamOpp"
- si enfin le tweet vient d'une personne "courante", on le marquera comme "externe"

Un même tweet, de même qu'il a plusieurs sentiments a plusieurs marqueurs.
Par exemple si Citoyens du Midi lance un tweet qui critique @CaroleDelga, profite un peu au passage à @Louis_Aliot et bien entendu met en en avant @Saurel2014
Ce même tweet est positif pour l'un, négatif pour l'autre, et un peu positif pour le tiers et il est "Team2 pour l'un et "TeamOpp" pour les deux autres.

Quand on observe les indicateurs pour chaque candidats avec une segmentation par marqueur (origine de la contribution) nous avons alors une très bonne vision de ce qui se passe:


Nous voyons ici que le deuxième candidat (qui n'est pas nommé) est très attaqué par ses opposants et ne doit son faible score, à peine positif, uniquement grâce au poids de sa propre équipe.
On voit également que le troisième candidat obtient la meilleure perception sociale, mais que c'est assez artificiel et que si l'on ne regarde que la contribution "externe", alors son résultat dans les urnes ne sera pas aussi bon...

Rappelons enfin que cet indicateur est un indicateur de synthèse qui consolide plusieurs indicateurs basiques qu'il est convient d'analyser aussi afin de mieux comprendre l'opinion exprimée.

Nous pouvons par exemple remarquer que certains comptes artificiels sont à l'origine d'immense quantités de tweets, mais de faible audience et don l'impact total n'est pas aussi important que pour un autre candidat qui a moins de soutiens mais de plus de poids...

Ces marqueurs permettent aussi de filtrer les influencers, les détracteurs etc:


L'exemple ci-dessus montre les comptes "Team" les plus positifs pour Philippe Saurel.
Ceci n'est qu'un extrait du tableau d'influencers, on y voit le sentiment moyen (qui peut aller de -100 à +100). Ce qui ne se  voit pas mais qui est intéréssant est que tous ces comptes ont un minimum de 300 tweets et certains dépassent les 1.000  tweets sur @Saurel2014 (en rapport avec les régionales et non juste avec la mairie de Montpellier) !!!



mardi 29 septembre 2015

Dominique Reynié rebondit en parachute

Nous avions écrit la semaine dernière un billet sur Dominique Reynié et sur l'évolution de sa perception sociale.

Ce dernier vient de se hisser à son plus haut résultat qu'il a obtenu le 28 septembre grâce à de très nombreux tweets et retweets qui ont accumulé une très forte audience et un sentiment plutôt positif:


Le nouveau maximum de perception sociale de Dominique Reynié est très nettement supérieur à son ancienne valeur. Ce saut dans le vide, même critiqué par certains qui auraient préféré que le saut en parachute ne soit pas accompagné, est donc une excellente opération!



samedi 19 septembre 2015

Deuxième négatif de Dominique Reynié

Cette semaine Dominique Reynié a eu son IPS (Indicateur de Perception Sociale) dans le rouge. Il convient de dire "deuxième" et non "seconde" car il est évident qu'il y aura une troisième fois...Ce qui est étonnant c'est que ce ne sot que la deuxième fois depuis le 1er août!


Alors que 'est-il passé ce 15 septembre?
En réalité pas grand chose... 


Quelques tweets très largement repris par des militants principalement du FN et du PS.

Comme dans le cas du 26 août (que nous avions aussi commenté ici) nous voyons que ce n'est qu'une attaque ciblée de faible portée car l'indicateur repart dans le positif dès le lendemain.