03/09/2018 les-crises.fr  33 min #145210

Comment Disinfolab n'a pas analysé le 4e groupe de son étude : « les médias + twittos Lrem »

(3) Nicolas Vanderbiest, une certaine idée de la neutralité #disinfogate

Nous allons aujourd'hui nous intéresser au comportement durant la présidentielle de Nicolas Vanderbiest, un des cofondateurs du DisinfoLab et son "chercheur" officiel. Précisons qu'au-delà, évidemment, de nos divergences incontestables, nous n'avons aucune animosité à son encontre ; dans nos analyses, nous sommes uniquement portés par une volonté d'informer, et d'alerter sur des éléments qui nous semblent hautement problématiques, comme c'est le cas ici.

Sommaire :

  1.  Un chercheur bien peu intéressé par les élections importantes
  2.  Un "chercheur apolitique" - qui n'aime pas du tout Le Pen
  3.  Un "chercheur apolitique" - qui n'aime pas trop Fillon non plus
  4.  Un "chercheur apolitique" - qui ne déteste pas trop Macron
  5.  L'incroyable acharnement sur Filteris
  6.  L'histoire d'Emmanuel Cahuzac
  7.  Et toujours ce comportement policier...
  8.  Déjà, la qualité Vanderbiest...
  9.  Conclusion

I. Un chercheur bien peu intéressé par les élections importantes

Voici comment Nicolas Vanderbiest a traité le Brexit sur Twitter, jusqu'au jour du vote (23 juin 2016) ; cela ira vite, il n'a fait que 3 tweets et n'a a priori tweeté aucun travail de sa part (Source : résultat de la recherche Twitter) :

Il faut dire qu'il s'est plutôt occupé de l'Euro 2016 de football (Belgique-Irlande le 18 juin par exemple) :

Mention spéciale à celui-ci :

Il s'est aussi occupé d'autres sujets annexes en juin :

Ceci étant, comme le 8 juin, le site Castorama.fr s'est fait  pirater son moteur de recherche, qui s'est retrouvé infesté de suggestions humoristiques :

Nicolas Vanderbiest a effectué une analyse des comptes Twitter qui ont parlé de ce sujet, grâce à son accès au logiciel Visibrain :

En revanche, il n'a donc réalisé aucune analyse de la campagne du Brexit...

Il faudra attendre un an et demi après l'élection pour que Nicolas Vanderbiest publie un graphe sur le sujet, dont vous apprécierez le thème :

Il a aussi réalisé un parallèle un "appel à données" :

Il a été à peine plus mobilisé sur la campagne américaine de 2016, avec une grosse dizaine de tweets entre septembre et l'élection de Trump en novembre.

Il a quand même réalisé UNE analyse :

Et une seconde sur le Débat Trump/Hillary du 26 septembre (où on voit qu'il a récupéré en quelques heures... 15 millions de tweets !) :

Rappelons "qu'analyse" est un bien grand mot, Visibrain sortant quasiment ces données automatiquement...

Ce manque d'intérêt reste étonnant, car Nicolas Vanderbiest trouve encore le temps le 8 septembre 2016 de faire des analyses fouillées sur les tweets traitant... de l'émission de Ruquier On N'est Pas Couché...

Ainsi, ni le Brexit ni la campagne américaine n'auront véritablement intéressé cet étudiant belge. Mais en revanche, il aura montré une incroyable activité sur la Présidentielle française de 2017 - dont on voit pourtant mal l'enjeu réel pour lui. Il posta durant cette période des dizaines de tweets par jour, menant même certaines croisades...

II. Un "chercheur apolitique" - qui n'aime pas du tout Le Pen

Voici une sélection de quelques tweets représentatifs du biais politique de Nicolas Vanderbiest, ce qui pose problème lorsque l'on se revendique « chercheur » et que l'on travaille sur les élections :

Et même :

Donc pas de politique - sauf bien entendu si c'est pour taper sur le candidat d'un tiers des électeurs français (rappelons que le monsieur est belge et vit en Belgique). D'ailleurs :

On observe que la bonne résolution précédente a duré au moins quelques minutes...

Mais :

Bref :

On note aussi cet intéressant échange :

On note ici la vision convergente du Directeur de Disinfo, Alexandre Alaphilippe, avec celle de Nicolas Vanderbiest.

Ce qu'il assume bien :

Poke Les Gauchos

On note enfin que, finalement, il ne semblait pas spécialement atterré par la présence de Marine Le Pen au 2e tour - qui arrangeait bien Macron :

III. Un "chercheur apolitique" - qui n'aime pas trop Fillon non plus

"Anti-fn" donc, mais pas que. On sent très bien à la lecture de ses tweets que Fillon n'est pas trop sa tasse de thé non plus :

"Kill Me Now" ?

On ne sait pas pourquoi ce choix, mais ceci arrive comme un cheveu sur la soupe :

Après le premier tour :

Il n'aime pas trop Boutin non plus, au passage :

Poke Christine Boutin

"LOL" ?

Et dans l'entre-deux-tours :

Ainsi, l'animosité de M. Vanderbiest envers certains candidats semble motiver son appétit pour le travail (ce qui constitue un sérieux problème lorsque l'on se revendique « chercheur »)

IV. Un "chercheur apolitique" - qui ne déteste pas trop Macron

A contrario, l'hostilité envers Macron est... limitée :

Eh oui, AUCUN autre candidat n'a été l'objet de rumeurs...

Ou un petit biais de sélection peut-être ?

Ah, nous n'avions pas la même timeline apparemment, c'est étrange...

Grandiose : petit souci, les outils statistiques s'obstinent à inclure bon nombre de journalistes/médias dans la communauté des militants Macron...

Reconnaissons cependant que N. Vanderbiest n'a pas soutenu Macron publiquement plus fortement que ces exemples. Mais il a régulièrement dénigré Le Pen et Fillon, ainsi que leur communautés...

Ce qui, de nouveau, pose un sérieux problème quand on se revendique "chercheur".

V. L'incroyable acharnement sur Filteris

 Filteris est une petite société canadienne créée en 2002, "spécialisée dans l'analyse d'images, la surveillance, la gestion et la sécurisation de l'identité numérique des entreprises, institutions ou personnalités". Elle comprend trois personnes titulaires d'un doctorat.

Depuis une dizaine d'années, cette société spécialisée dans l'analyse des données sur la Toile réalise, lors de certaines élections, des études permettant de mesurer "le buzz et la sentimentalité associés à chaque candidat" sur Internet, avec un algorithme qu'ils ont développé qui mesure les « perceptions, avis et opinions » positives et négatives « librement exprimés sur le Web et les réseaux sociaux ». Elle se contente donc d'analyser Twitter, Facebook (quand les publications sont publiques), les forums, les blogs, ainsi que les commentaires publiés sous les articles des sites d'information, sans réaliser de sondages auprès de personnes physiques. C'est de la simple analyse de données publiques. Cependant, selon Filteris, ce "poids politique" sur le web et les réseaux sociaux serait fortement corrélé aux résultats électoraux de chacun.

Mis à part pour Le Pen, l'analyse Filteris de 2012 était très proche du résultat final :

Bref, Filteris propose un outil complémentaire aux sondages, avec une nouvelle méthodologie. Si la société n'entretient pas de confusion avec un sondage réel, il n'y a donc aucun problème : il faudra tester ceci sur de nombreuses élections afin d'en valider la robustesse.

Précisons que nous ne sommes nullement en train de défendre cette société : nous ignorons totalement la fiabilité de ces études (l'algorithme est évidemment secret) et plus largement, nous rappelons que nous sommes pour l'interdiction des sondages politiques : le vote étant secret, l'intention de vote l'est aussi, et cet outil hautement critiquable a forcément pour effet d'impacter le vote lui-même. Ou, à tout le moins, que les scores soient annoncés non pas avec un chiffre, mais avec la place d'incertitude, et que soient publiés les résultats bruts ; ainsi, on n'aura pas "Macron 22,7 %, Le Pen 21,1 mais Macron [20-24 % ; 18 % en brut] et Le Pen [19-23 % ; 15 % en brut] par exemple.

Mais les sondeurs ayant lourdement échoué à de multiples reprises - Balladur, Jospin, Brexit, Trump... on voit mal pourquoi on ne laisserait pas une chance à cette nouvelle méthode complémentaire - à partir du moment où la société présente honnêtement son travail. Ce qu'elle a apparemment plutôt bien fait :

Or, en 2017, les analyses de Filteris montraient souvent Fillon au deuxième tour, comme encore ici dans leur dernière vision, 2 jours avant le 1er tour :

On note bien qu'ils parlent du "poids numérique", du "buzz" généré, issu d'une analyse "big data"

Voici donc la comparaison entre le "bruit numérique" calculé par Filteris, et le résultat final :

Évidemment, il y a eu une forte sous-évaluation de Macron - qui disposait de peu de militants actifs comparé à d'autres. Mais pour le reste, les résultats de Filteris sont tout à fait intéressants pour des évaluations Big Data sans sondage, qui sont toujours en cours de rodage d'algorithme.

Comparons à ce sondage du Monde du  14 avril :

Au final, c'est un peu mieux que Filteris, mais pas tellement mieux.

Le fait de présenter Fillon 4e à 3 points de Marine Le Pen, et Mélenchon 3e est un lourd échec, sachant que Fillon finira avec à peine plus d'un point d'écart. On voit là tout le problème des sondages (et à fortiri d'une présentation en chiffres et non en intervalle) : combien d'électeurs de Fillon, croyant à ce sondage auront-il décidé de voter Macron pour être sûr d'éviter un second tour Mélenchon/Le Pen ?

Rappelons aussi que ces sondages sont réalisés avec une marge d'erreur théorique de 2 points (sans doute au moins 3 à 5 points en réalité, au vu de l'imperfection des échantillons des sondages).

Ainsi, on note que Filteris a été relativement clair sur ce qu'il faisait, et que, à part l'évaluation de Macron, ses résultats apparaissent comme plutôt honorables. Comme on ne connait évidemment pas leur algorithme, on ne peut savoir si c'est parce que leur méthode marche, mais reste à roder, si c'est du hasard ou s'ils ont rentré des chiffres qui leur plaisaient. C'est seulement au fil du temps et de la confrontation avec la réalité qu'on pourra l'apprécier.

Ensuite, il est vrai que les soutiens de Fillon se sont rués sur les résultats Filteris, qu'ils ont souvent présenté comme un sondage ou une prévision fiable - mais un sondage n'est pas non plus une prévision fiable. C'est de bonne guerre, c'était une des rares qui leur donnait de l'espoir - espoir tout à fait normal sachant que Fillon n'a perdu à la fin que d'à peine un gros point.

Nous vous laissons donc apprécier, après cette longue introduction, le comportement de Nicolas Vanderbiest en croisade contre les "charlatans" (note : si vous manquez de temps, vous pouvez simplement survoler les échanges, c'est édifiant) :

Ce qui finit par faire réagir Filteris :

Mais l'intérêt scientifique n'est pas la priorité de M. Vanderbiest :

Le tout finissant par l'accusation délirante de... "complotisme" ! (bienvenue au club, Filteris !)

Vous pouvez en effet lire le fameux thread (fil de discussion) dont parle Vanderbiest,  il est ici (archivé  ici,  ici et  ), pour voir à quel point l'accusation est hors de propos. Finalement, le seul argument avancé par Nicolas Vanderbiest est que ce sont des charlatans qui utilisent en partie Twitter dans leurs analyses, et que Twitter n'est pas représentatif de la population. C'est vrai, mais cela n'empêche nullement un algorithme d'en redresser ces résultats pour coller à la population générale ; ce qui est probablement ce qu'ils font, sinon, à l'évidence, sans quoi leurs résultats seraient vraiment très très éloignés de la réalité.

Et le gros souci dans l'attitude de Vanderbiest est qu'il se permet un tel acharnement alors qu'il ne connait en rien la méthodologie de Filteris :

La "méthodologie" serait du vent - mais hélas, il ne la connait pas...

Il est à noter qu'ils sont du genre vraiment très calme chez Filteris, car, malgré ce genre de propos :

#DevoirDeService_À_LaSociété #Fake_Communiqués_de_Presse

ils continuent à dialoguer posément, en essayant de s'expliquer :

Pour juger, en effet, de l'obsession de M. Vanderbiest, voici un extrait de ses tweets sur Filteris :

Comme quoi, Filteris lui aura semblé bien plus important que le Brexit et l'élection de Trump...

Bien entendu, il en rajoutera une couche au soir du 1er tour :

Les journalistes qui n'ont pas applaudi Macron ?

"Les sondages" : 30 ans de succès continus feront toujours la différence

faisant comme si l'élimination de Fillon pouvait scientifiquement être prédite, ce qui est totalement faux statistiquement parlant au vu du mouchoir de poche dans lequel se trouvaient les 4 premiers candidats...

Mais dès lors, et de façon très étonnante, la presse s'est déchainée contre Filteris après le premier tour, et a systématiquement donné la parole à Nicolas Vanderbiest qui a ainsi pu déverser sa bile sur eux, et essayer de décrédibiliser une méthode scientifique en rodage - lire  Le Monde,  Libération une fois,  Libération deux fois,  Les Échos,  Le Point,  Numérama,  Ina Global, etc. :

On comprend cependant mieux la prudence avec laquelle la presse a traité cette affaire DisinfoLab, au vu de la publicité faite par eux à M. Vanderbiest...

Pour conclure cette partie, on notera que les spécialistes de Filteris ont fini par se rendre compte de l'imposture scientifique de leur interlocuteur (qui n'est qu'un étudiant, en thèse de communication depuis 5 ans, enseignant en média training...  source  image) :

#OuPas :

"Filteris est juste une énorme masse de merde"

Le plus extraordinaire est que chez Filteris, ils ont bien vu que Nicolas Vanderbiest semblait mentir sur son profil Twitter, usurpant la qualité de titulaire d'un PhD (= doctorat), qu'il n'a jamais eu :

et alertant l'Université de Louvain :

Celle-ci n'a pas réagi, car le 7 août 2018, il y avait toujours ceci sur son profil, désormais étoffé :

Au 2 septembre, le profil a enfin été nettoyé, redonnant à M. Vanderbiest son juste rôle : blogueur (oubliant de préciser son rôle central dans la galaxie Saper Vedere / DisinfoLab) :

Voici donc les méthodes du cofondateur de DisinfoLab, censé lutter contre la Désinformation...

VI. L'histoire d'Emmanuel Cahuzac

Dans l'étude DisinfoLab d'août 2018 figure ceci, à propos des "désinformations partagées" durant la présidentielle ( source) :

On note au passage que si les 5 premières ont bien été identifiées par Checknews ( Blanchissement,  Mayotte,  Loyers,  Rolex,  Arabie), il n'en est a priori pas de même pour les 4 dernières :

L'histoire de la dernière, "Macron Cahuzac", est intéressante. En fait, tout part d'un billet sur un blog Médiapart, posté le 14 avril 2017 et intitulé :  Emmanuel Macron, un nouveau Cahuzac ? ( archive)

C'est en fait un court billet d'opinion, qui n'apporte aucun fait, et pose quelque sous-entendus - disons que c'est une petite crapulerie (hélas) assez fréquente en politique. En voici quelques extraits qui résument la vision développée :

À quelques jours de l'élection, alors même que les équipes d'En Marche sentent poindre le risque d'une mauvaise surprise, les journalistes continuent leur exercice ambigu de storytelling du phénomène Macron. Là où Fillon subit un lynchage permanent, aucun nuage ne saurait venir gâcher le ciel bleu sous lequel évolue Emmanuel Macron. Et pourtant l'amoncellement d'affaires, de sa déclaration de patrimoine suspecte, à ses relations troubles avec la banque Rothschild, en passant par le cabinet noir piloté par François Hollande pour servir son fils spirituel, devrait concourir à assombrir l'avenir de l'ancien ministre de l'Économie. Présenté comme l'enfant prodigue de la France et de Hollande, Emmanuel Macron ne marcherait-il pas dans les pas d'un autre socialiste, tout aussi sulfureux, Jérôme Cahuzac ?

Alors certes, comparaison n'est pas raison, et loin de nous l'idée d'établir des analogies et des corrélations qui pourraient s'avérer problématiques. Néanmoins, et n'en déplaise à Emmanuel Macron et à ses soutiens, les faits sont têtus. Le parcours de Macron ne va pas sans susciter quelques interrogations : par quels moyens un individu, inconnu il y a quelques mois, peut-il se retrouver à une telle position ? [...] Autant de personnages complexes, qui ont alternativement joué un rôle considérable dans l'ascension de Macron aux plus hautes marches de la république. Autant de personnages auxquels Macron est dévoué, et forcément redevable. [...]

À partir de là, plus aucun doute ne peut subsister. Macron est un acteur de théâtre, doté d'un talent au demeurant questionnable, comme l'ont montré ses piètres performances dans les différents débats de la présidentielle. En coulisse, une nuée d'individus, plus ou moins recommandables, lui écrit son rôle, rédige ses répliques, le met en scène, et construit le décor. Dans notre démocratie, le phénomène Macron est une première. Il a de quoi choquer et révolter celles et ceux attachés à une certaine idée de la vérité et de l'éthique en politique.

La double-face de Macron est saisissante. Emmanuel Hollande ne le décrit qu'à moitié. Il y a chez lui une duplicité qui peut tout autant faire penser à Jérôme Cahuzac. Qui voudrait d'un Emmanuel Cahuzac à la tête de la France ?

Bref, l'article se demande si Macron ne serait pas de la trempe d'un Cahuzac - et on se demande donc si c'est une allusion à un compte à l'étranger ou plus simplement, vu le ton de l'article, à un caractère plein de duplicité.

Mais comme 75 faux comptes Twitter ont été créés la veille pour diffuser le lien vers ce message, Nicolas Vanderbiest en fait une très longue étude - qui ne conclut pas à grand-chose, à part qu'il y a eu une opération avec des faux comptes ( source).

Rappelons qu'il n'est nul besoin d'un grand talent à M. Vanderbiest pour réaliser cette étude (il n'y a qu'à la lire pour être édifié par la forme d'ailleurs). Il a tout simplement un accès quasi illimité à la base Twitter, via Visibrain (dans des conditions auxquelles nous nous intéresserons bientôt #Poke_Visibrain). De là, il est simple de remonter la diffusion du tweet, et d'avoir toutes les informations sur les comptes...

Mais ce qui est intéressant est de voir comment cette petite manœuvre minable à la base, est vendue par Nicolas Vanderbiest comme une énorme "opération de déstabilisation" d'Emmanuel Macron (si on est "déstabilisé" par ça, il vaut mieux songer à un autre métier...) :

Le tout étant rapidement relayé par des journalistes qui  interviewent complaisamment Vanderbiest - sans jamais se demander dans quelles conditions il a accès à ces données.

D'ailleurs le billet n'est tellement pas scandaleux que Médiapart n'a pu le supprimer, car il ne violait pas la charte du site ni la loi ( source) :

Mais on voit bien que toute personne qui aura diffusé ce texte non diffamatoire (et ridicule) sera désormais considérée par Nicolas Vanderbiest comme "désinformateur" dans ses prochaines études...

VII. Et toujours ce comportement policier...

On retrouve au passage toujours cette mentalité vanderbiestienne de ficher :

Ci-dessus, ce sont 6000 profils identifiés comme gros retweeteurs de RT (Russia Today, sic.)...

Ci-dessous, ce sont tous les comptes qui ont publié un #SortonsMacron qui sont récupérés, stockés, analysés et classés pour la plupart en "fachosphère" (sic.), graphiques à l'appui :

Ici les personnes qui ont propagé 3 rumeurs - attention la police veille :

Ici, il repère les 1000 comptes qui ont le plus soutenu Fillon (sic.) et analyse ceux qu'ils disent via leurs hashtags :

Ici, il regarde ceux qui ont propagé le plus de rumeurs :

et les corrèle à ceux qui sont les plus actifs à propager Russia Today (mais dommage, on aurait aimé savoir combien propageaient aussi Le Monde et BFM, au cas où ce soient des comptes qui relayent simplement tout et n'importe quoi).

Bref, encore un bel exemple d'individu ayant raté sa vocation de policier.

VIII. Déjà, la qualité Vanderbiest...

Le 6 mai 2017, Nicolas Vanderbiest parle des "Russophiles" ayant diffusé les Macronleaks :

Et là, nous avons la surprise de trouver notre compte Twitter dans cette liste, dont on comprend aujourd'hui que c'est une extraction Visibrain des comptes Twitter (avec les Biographies) :

N'ayant pas creusé le sujet, nous pensions à l'époque que cela ne recensait que des comptes de gros sites, pas de personnes

Puis Nicolas Vanderbiest, n'en restant pas là, tweete sans raison ceci :

Tweet de qualité, retweeté par Gary Machado (photo n°3) - merci à lui

Comme nous ne le connaissions pas, et qu'à l'époque nous pensions donc avoir affaire à un PhD chercheur universitaire, j'avais protesté et commencé à dialoguer calmement en message privé :

Je lui ai évidemment demandé en premier lieu à quels complots j'étais censé adhérer - ce qui a causé un évident malaise, car il n'en savait rien de prime abord.

Je garde évidemment secret le détail de notre long échange, mais en résumé, il en ressortait que j'étais cité car : 1/ j'étais passé plusieurs fois sur RT (sic.) 2/ que j'avais été mentionné par des pro-russes (re.sic.)

Mais comme le fond de la diffamation portait sur le complotisme, que M. Vanderbiest m'a diffamé une première fois en 2017 et plusieurs fois le mois dernier, je me permets de publier simplement ce très bref extrait, afin de participer à la manifestation de la Vérité, où il s'expliquait suite à mon insistance sur les raisons de sa grave accusation :

Mon travail sur le patrimoine de Macron était ainsi la principale raison de son avis - étrange. Comme je précisais que c'était à la base un travail remarquable du Canard enchainé, il répliqua ceci :

Ok, donc "Anti-Macron + RT + sapir", mon compte était bon, direction la case complotisme...

Nicolas Vanderbiest a donc fait sienne la devise de bon nombre de jeunes journalistes actuels : "Contacter la personne et l'interroger avant de la diffamer, c'est tellement XXe siècle"...

Mais on se rend ici compte d'un point qui ne nous avait pas alerté à l'époque :

"Justement l'article du Canard datait énormément et les spécialistes du domaine disaient que ca ne tenaient pas la route."

C'est proprement délirant : l'article du Canard avait environ 9 mois, et, moi qui ai suivi de près cette histoire, je n'ai pas souvenir d'avoir entendu le moindre spécialiste dire que les questions que j'avais soulevées ne tenaient pas la route... Monsieur Vanderbiest sortait ici des éléments de langage qui étaient quasiment ceux de l'équipe de campagne de Macron - qui étaient les seuls à tenir ce genre de propos. Un citoyen lambda, même ayant creusé le sujet, ne peut sérieusement avancer de tels arguments au vu des sources qu'il pourrait trouver, même critiques...

Ceci étant, je pensais à la fin l'avoir convaincu, et qu'il était de bonne foi, car il supprima son tweet et présenta des excuses :

Bref, comme on dit "Excuses acceptées !". Mais hélas :

Conclusion

Nous avons montré dans cette partie que le "chercheur de la petite ONG belge", qui avait délaissé la campagne du Brexit et de la Présidentielle américaine de 2016, s'était très fortement investi sur la Présidentielle française. Sans qu'on comprenne bien pourquoi - quel était donc l'enjeu réel pour un étranger ?

Et qu'il l'avait fait dans une posture "anti-FN" revendiquée, mais également avec un clair tropisme anti-Fillon - l'acharnement sur Filteris en étant une bonne illustration.

On voit donc que tout ceci ne peut qu'induire un biais dans ses analyses ; la position de militant n'est pas compatible avec une qualité de chercheur travaillant sur les élections.

Mais nous verrons dans le prochain billet qu'il ne s'est pas contenté de simples écarts à la neutralité - et qu'il a fait nettement pire...

RAPPEL : L'affaire prenant de l'ampleur, nous avons vraiment besoin de votre soutien. Dans un premier temps, vous pouvez nous le témoigner d'une façon très simple et rapide : en vous abonnant à  notre fil Twitter et en "likant"  notre page Facebook, si ce n'est pas déjà fait. Cela montrera la taille de notre communauté et son implication. On compte sur vous - ce sera notre récompense pour tout le travail que nous menons !

 les-crises.fr

 Commenter