24/04/2017 numerama.com  10min #127923

 Macron I : en exclusivité et en avant-première, le menu du ministrone du 9 mai 2017

Filteris ou l'échec cuisant du big data face aux sondages

L'entreprise Filteris s'est fait remarquer pendant la campagne présidentielle en publiant régulièrement ses mesures du « poids numérique » des candidats, qui plaçaient systématiquement François Fillon au second tour. Les données, relayées massivement par ses partisans, ont prouvé leurs limites face aux instituts de sondage, qui ne se sont pas privés de lui faire remarquer une fois les résultats connus.

 Il n'y aura pas eu de vote caché pour François Fillon au premier tour de l'élection présidentielle, comme l'espéraient ses partisans :  Emmanuel Macron et  Marine Le Pen s'affronteront le 7 mai prochain. Les soutiens du candidat Les Républicains s'appuyaient tout particulièrement sur les chiffres donnés par le cabinet Filteris, une société canadienne fondée en 2002 et  spécialisée dans « l'analyse d'image, la surveillance, la gestion et la sécurisation de l'identité numérique », qui indiquaient une tendance inverse à celle des sondages.

Filteris s'est en effet fait remarquer pendant la campagne présidentielle en publiant régulièrement ses analyses du « poids numérique » des candidats, censées prédire les intentions de vote des Français, en se basant sur des analyses de données publiques récoltées sur les réseaux sociaux. L'entreprise procède à cette pratique aux contours volontairement flous depuis les élections fédérales canadiennes de 2006. Dans ses études sur la présidentielle, François Fillon apparaissait toujours qualifié au second tour et souvent en tête des intentions de vote.

Un scénario que Valeurs actuelles et les soutiens du candidat Les Républicains s'empressaient de relayer à chaque fois pour affirmer l'existence d'un vote non pris en compte dans les sondages. Dans sa dernière publication avant le premier tour, Filteris annonçait ainsi comme quatuor de tête Marine Le Pen Fillon à 22,7 %, François Fillon à 21,5 %, Jean-Luc Mélenchon à 21,3 % et Emmanuel Macron à 20,03 %.

Mesure  #FILTERIS /  #EUROMEDIATIONS du 21 avril - 23h50 /  #poidsnumérique des candidats à la  #présidentielle2017  #Buzz  #Bigdata  pic.twitter.com/1Kf8aq1fEw

FILTERIS CANADA (FILTERIS_CANADA) 𝕏 April 21, 2017

Des chiffres peu indicatifs et faussés par les bots

Critiqué pour le manque de transparence des algorithmes de Filteris, son fondateur, le Français Jérôme Coutard, était monté au créneau  dès le vendredi 21 avril auprès des Échos : « Je rappelle [..]. que nous ne calculons pas des intentions de vote mais un « poids numérique » à travers lequel on tente de faire une corrélation avec le résultat à venir ». Notre société n'est pas spécialisée dans la politique. Ce n'est pas notre marché, nous ne gagnons pas d'argent avec ça. Nous ne sommes affiliés à aucun parti politique et pas en guerre contre les sondeurs. » Le manque de neutralité potentiel de la société a toutefois aussi été épinglé en raison de la présence à son capital de Daniel Quéro,  ami de longue date de Pierre Fillon, frère du candidat de la droite.

Reste qu'il est toujours compliqué de prendre le pouls d'une élection sur les réseaux sociaux, comme Twitter (à plus de 90 % dans le cas de Filteris) : il est loin de représenter la majorité du corps électoral et un bruit médiatique n'égale pas une intention de vote. De plus, il est souvent difficile d'en tirer une intention, l'intelligence artificielle ayant par exemple encore bien du mal à saisir l'ironie comme l'humour de certains commentaires  ou encore à déceler les fausses rumeurs.

Surtout, la prolifération de bots au service d'un candidat fausse les statistiques, même si Filteris a fait le choix de les prendre en compte dans ses analyses, au motif qu'ils augmentent techniquement la visibilité de la personne en question. Quant à son expérience récente, aux primaires de la droite, Filteris avait bien prédit la victoire de François Fillon mais plaçait Nicolas Sarkozy en deuxième position, devant Alain Juppé. L'entreprise avait en revanche complètement raté la percée de Hamon aux primaires de la gauche.

CC Rama

Les instituts de sondage trollent Filteris

Dimanche soir, les plus fervents critiques de Filteris n'ont pas perdu de temps pour tourner en dérision le modèle d'analyse de l'entreprise. 𝕏 À commencer par Nicolas Vanderbiest, assistant à l'Université catholique de Louvain et consultant dans le domaine des réseaux sociaux,  qui parlait récemment de « charlatanerie » à propos de l'entreprise : « [..]. Je reste persuadé que leurs chiffres sont en fait des pondérations de sondages. Il n'y a aucune logique data dans leurs flux. »

On résume :

- Google Trends
- Indicateurs Web
- Le Big Data de non-diplomés de l'écoles des Mines
- Filteris, whatever

🚮

- Les sondages👯

Nicolas Vanderbiest (Nico_VanderB) 𝕏 April 23, 2017

Les différents instituts de sondage, qui avaient correctement pronostiqué le second tour Macron/Le Pen, ont aussi saisi l'occasion pour se moquer de ce concurrent particulièrement médiatisé pendant la campagne, après avoir eux-mêmes été très critiqués ces derniers mois pour leur prétendue non-fiabilité ou leur influence supposée sur les choix des électeurs.

Odoxa rappelait ainsi ses prédictions très proches du résultat final 𝕏 en joignant Filteris en « cc » sur Twitter, tandis que  l'Ifop envoyait un gif moqueur tiré de The Big Lebowski à l'entreprise avant de le supprimer.

Un écart moyen de 1,07 %

Beau joueur, 𝕏 Jérôme Coutard a reconnu sur Twitter la défaite de sa méthode d'analyse face aux sondeurs : « Les sondeurs ont eu leur revanche, bravo, c'est mérité. Mais les méthodes de collecte et d'analyse alternatives + IA se peaufinent. »

Les sondeurs ont eu leur revanche bravo 😉c'est mérité. Mais les méthodes de collecte et d'analyse alternatives + IA se peaufinent.

JÉRÔME COUTARD (Filteris) 𝕏 April 24, 2017

De son côté, Filteris a publié 𝕏 un communiqué reconnaissant son échec et l'écart moyen de 1,07 % entre ses mesures et les  résultats officiels du ministère de l'intérieur : « À l'issue de ce scrutin, Filteris, qui n'est pas un institut de sondage, comme nous l'avons sans cesse mentionné, n'a pas atteint le degré de précision qu'elle escomptait. [..]. Les écarts constatés nous permettent d'émettre des hypothèses, que nos équipes vont continuer à explorer en tenant compte de différents éléments de contexte, qu'ils soient technologiques (bots, fake news...), sociologiques, médiatiques... »

En attendant, Filteris a déjà publié 𝕏 ses mesures du poids numérique des candidats du second tour : Emmanuel Macron domine à 59,8 % contre 40,1 % pour Marine Le Pen. Cette fois-ci, au moins, Filteris et les sondages s'orientent dans la même direction,  Ipsos Steria créditant le candidat d'En Marche ! de 62 % d'intentions de vote contre 38 % pour son adversaire du Front national.

Suivez l'actualité de la  Présidentielle 2017

 numerama.com