Élection présidentielle : les sondages d'opinion sont-ils fiables ?

Les sondages en vue des échéances électorales occupent depuis un certain temps une place centrale dans la vie politique française. L'élection présidentielle de 2022 ne fera pas exception. La question de la fiabilité des sondages électoraux arrive inévitablement comme corollaire à leur utilisation, mise en avant par les différents candidats selon leurs infortunes sondagières.

Qu'en est-il réellement ? Que peut nous apprendre l'histoire récente sur ces sondages électoraux ? Sont-ils un outil plus ou moins neutre de mesure de l'opinion publique ou bien constituent-ils un dangereux moyen d'influence ?

Pour tenter de le savoir, il est nécessaire de revenir brièvement sur la genèse de cette industrie du sondage et de comprendre les méthodes employées pour révéler les préférences de l'opinion publique.

La naissance des instituts de sondages aux États-Unis

Les instituts de sondages commerciaux naissent aux États-Unis au cours des années 1930, fondés séparément par Georges Gallup, Elmo Roper et Archibald Crossley. Ces instituts connaissent leur heure de gloire lors de l'élection présidentielle américaine de 1936, où ils parviennent à prédire correctement la réélection de Franklin Roosevelt. Basés sur la sélection d'un échantillon représentatif de la population, ils s'opposent à la pratique des « votes de paille » qui consistait à interroger un grand nombre d'Américains sans rigueur méthodologique particulière.

Ainsi, en 1936, le journal Libertary Digest sonda 20 millions de lecteurs et prédit une large défaite du président Roosevelt. En interrogeant ses lecteurs, davantage situés à droite de l'échiquier politique, le Libertary digest avait capté une vision tronquée de l'opinion politique du pays malgré le nombre important de personnes interrogées. Cet échec consacra la victoire de la « méthode scientifique » des sondeurs.

En France, la pratique des sondages électoraux ne s'impose réellement dans les campagnes électorales qu'à partir de 1964 avec le choix du suffrage universel pour désigner le président de la République. Pourtant, le sujet des sondages reste empreint de suspicion en France. Accusés de manipuler l'opinion, ils ne bénéficient pas de la réputation scientifique dont ils peuvent se prévaloir ailleurs. Le sociologue français Pierre Bourdieu  lance ainsi la charge en 1986 :

« Je pense qu'il y a un abus de science []... et, à ce titre, je souhaiterais beaucoup que les institutions effectuant des contrôles efficaces soient mises en place et qu'en tout cas le soupçon se généralise. »

Cette dénonciation des sondages, ou plutôt de la façon dont ils sont utilisés dans l'espace médiatique et politique, est un combat de longue date du sociologue Pierre Bourdieu. Dans un texte au nom provocateur, « L'opinion publique n'existe pas », publié en 1972, il explique que les sondages produisent, sur les personnes interrogées, un effet d'imposition de problématique. Les sondés se sentent obligés de répondre à une question à laquelle ils n'ont jamais songé ou qu'ils n'avaient pas formalisée en ces termes.

Les réponses fournies ont donc une valeur très relative. Présenter l'état de l'opinion sous forme de pourcentage est très réducteur du fait que l'opinion individuelle se forge dans un environnement dynamique, soumis à de multiples influences. Aussi, comme le note malicieusement Pierre Bourdieu, les sondages informent moins sur l'état réel de l'opinion publique que sur l'état d'esprit des commanditaires des sondages, et plus largement sur l'état d'esprit des classes dominantes.

La méfiance envers les sondages n'est pas une spécificité du monde intellectuel et académique, mais elle infuse plus largement la société française. Les pouvoirs publics ont ainsi créé dès 1977, la Commission des sondages chargée de réguler la production et la diffusion des sondages d'opinion. Cette régulation par une autorité administrative indépendante est unique parmi les pays développés, la profession sondagière étant plutôt soumise à des modes d'autorégulation ailleurs dans le monde.

Les méthodes des sondages

La sélection d'un échantillon représentatif de la population est une innovation essentielle des sondages d'opinion. Cela permet à la fois de diminuer le coût du sondage, en raison de la quantité réduite de personnes interrogées, mais aussi d'augmenter la fiabilité du résultat obtenu, par exemple en calculant une marge d'erreur au sondage. Deux méthodes peuvent être employées : la méthode d'échantillonnage aléatoire (la plus fiable) et la méthode d'échantillonnage par quota.

L'échantillonnage par quota est la méthode utilisée dans la grande majorité des sondages d'opinion en France et dans le monde. Il consiste à reproduire à partir des données du recensement un échantillon de population qui est le plus proche possible de la population générale. Les variables de sexe, âge, catégories socioprofessionnelles et lieu d'habitation sont ainsi utilisées comme variables de contrôle afin de s'assurer que l'échantillonnage est conforme à la réalité sociale du pays.

Variables de contrôle pour la réalisation du sondage Harris Interactive du 8 décembre 2021. La colonne « brut » correspond aux caractéristiques de l'échantillon et la colonne « redressé » à celles de la population totale.

Le problème de la méthode par quota est qu'elle ne constitue pas un tirage aléatoire des individus et à ce titre, il n'est pas possible de calculer une marge d'erreur à ces sondages. Malgré tout, les sondeurs continuent d'utiliser ces marges d'erreur, car elles constituent un gage de sérieux et de crédibilité scientifique auprès de la population et du commanditaire.

Parmi les notices techniques publiées sur le site de la Commission des Sondages, seul l'institut IPSOS prend la peine de signaler cette non-scientificité de la marge d'erreur calculée pour les sondages par quotas :

« L'intervalle de confiance (appelé aussi marge d'erreur) []... ne peut pas être déterminé dans le cas de sondages par quotas mais on considère qu'il est proche de celui des sondages aléatoires. »

La méthode des quotas expose également les instituts de sondages à un nombre important de biais qui faussent leur capacité prédictive. En effet, avec la méthode par quota, on vient supposer que l'opinion des individus est fortement déterminée par certaines variables de contrôle comme l'âge ou le statut social.

Or, si certaines tendances peuvent se dégager ainsi, d'autres variables sont également importantes (origine familiale, pratique religieuse...) dans la détermination de l'opinion individuelle, de même que certains évènements personnels qui confinent à l'intime. Dès lors, il est impossible de capturer l'ensemble des opinions présentes dans la population en se basant sur un nombre aussi restreint de variables de contrôle.

D'autres biais tiennent à la qualité des réponses des personnes interrogées. Comment s'assurer que l'opinion formulée est bien celle de la personne interrogée et non celle qui est « socialement acceptable » dans le cadre d'une interaction sociale ? Comment s'assurer de même que les personnes qui répondent au sondage sont effectivement représentatives de la population ?

En effet, les individus qui sont disposés à donner leur avis dans le cas d'un sondage ne sont pas forcément représentatifs de l'ensemble (le niveau éducatif prédispose ainsi les individus à répondre aux questions des sondeurs de même que l'intérêt personnel pour la politique).

Redresser les tord

Pour tenir compte de ces biais, les sondeurs pratiquent dans leurs sondages par quota des « redressements statistiques » en se basant sur les déclarations de vote aux élections précédentes ainsi qu'un certain nombre d'autres variables propres à chaque institut. Le statisticien américain Leslie Kish déclarait ainsi au sujet des sondages par quota :

« L'échantillonnage par quota n'est pas une méthode scientifiquement définie. Au contraire chacun de ces sondages ressemble à une production artistique, difficile à définir ou à décrire. »

Dans le cas des sondages pour la présidentielle française, les sondeurs procèdent aux redressements en fonction principalement de la question suivante : « Quel a été votre vote au cours de la dernière élection présidentielle ? ». Cette question a pour but de déterminer les coefficients de redressement à appliquer auprès des partis « stigmatisés » par leurs adversaires pour leur caractère « extrême ».

Dans l'exemple suivant, on voit que le vote Mélenchon est déclaré à 14,7 % par les personnes interrogées pour le sondage alors qu'il a réalisé près de 20 % à la présidentielle de 2017. Dans ce cas, les sondeurs vont appliquer un coefficient multiplicateur de 1,36 aux intentions de vote se portant sur Jean-Luc Mélenchon pour 2022. De manière similaire, certains votes socialement acceptables comme le vote Macron, le vote LR ou encore le vote PS doivent être redressés négativement, c'est-à-dire qu'il faut diminuer les intentions de vote « brutes » issues de ce sondage.

Redressement effectué par l'IFOP en fonction du vote au premier tour de l'élection présidentielle de 2017 - Source

Cette technique de redressement a également ses limites. Certes, on observe effectivement une certaine stabilité des comportements électoraux, ce qui permet, via l'utilisation des coefficients de redressement, d'améliorer la qualité prédictive des sondages.

Néanmoins, les comportements électoraux ne sont pas non plus immuables d'une élection sur l'autre. L'apparition de « nouveaux candidats » ou partis ajoute à cette instabilité en raison du manque de recul comparatif. La candidature Zemmour doit-elle être redressée de manière négative ou positive ?

Validité des sondages électoraux

Empiriquement, les sondages électoraux ont-ils une capacité prédictive ? L'analyse des 4 derniers scrutins présidentiels (de 2002 à 2017) donne pour le moins une image contrastée. Il apparaît de manière systématique que les sondages ne présentent aucune capacité prédictive avant la période février-mars de l'année de l'élection.

En effet, lorsque les individus sont interrogés trop en amont sur leurs intentions de vote, le manque de connaissance et d'intérêt pour la nouvelle structuration de l'offre politique amène à des réponses peu prédictives de leur comportement électoral ultérieur (effet d'imposition de problématique).

À l'inverse, à mesure que la compétition électorale s'intensifie et que les choix programmatiques deviennent clairement identifiés, alors les réponses des sondés deviennent-elles aussi beaucoup plus opérationnelles. La période située entre février/mars et avril doit donc être considérée comme la véritable « période test » pour mesurer l'efficacité des sondages électoraux.

La présidentielle de 2002 avait marqué les esprits en raison de la qualification surprise de Jean-Marie Le Pen au second tour de la présidentielle au détriment du candidat socialiste Lionel Jospin. Tous les sondages annonçaient pourtant la qualification de ce dernier avec une confortable marge d'avance sur son poursuivant d'extrême droite, y compris dans les dernières semaines précédant le premier tour. L'efficacité des sondages d'opinion avait été fortement remise en cause à ce moment.

La présidentielle de 2007 a, à l'inverse, marqué une surestimation du vote Le Pen entre février et avril 2007 par rapport à son score final au premier tour. Les candidats Ségolène Royal (PS) et Nicolas Sarkozy (UMP) ont quant à eux réalisé un score légèrement supérieur à ce que prédisaient les derniers sondages électoraux. Néanmoins, l'ordre d'arrivée des candidats a été relativement conforme à ce qu'anticipaient les instituts de sondages.

La présidentielle de 2012 tranche en revanche avec celle de 2007 en particulier en ce qui concerne les votes « radicaux » autour de Marine Le Pen et de Jean-Luc Mélenchon. En effet, alors que les sondages annonçaient entre mars et avril 2012 un « quasi-croisement des courbes » entre Jean-Luc Mélenchon et Marine Le Pen c'est finalement l'extrême droite qui réalisera le score le plus important.

Un premier enseignement à tirer de cet inventaire, c'est que les « redressements » systématiques réalisés par les instituts de sondages ne sont pas toujours opérants. En se référant aux scores des élections présidentielles précédentes, ils calquent les situations passées « uniques » sur celles de la situation présente, ce qui a peu de chance de se réaliser. Ainsi, le score historiquement élevé du vote Le Pen en 2002 a conduit à le surestimer en 2007 en appliquant un important coefficient de redressement.

Or, les raisons qui ont conduit les votants de 2002 à choisir Jean-Marie Le Pen ne se retrouvaient pas en 2007 d'où un important décalage avec la réalité. De la même façon en s'inspirant du vote de 2007, les sondeurs ont appliqué un coefficient de redressement moins important au vote Le Pen de 2012, conduisant cette fois à sous-estimer le niveau du vote en faveur de l'extrême droite. Cet effet de « balancier électoral » (qui est une constatation empirique et non pas une notion des sciences sociales) conduit donc à relativiser l'efficacité de la méthode des « redressements » appliqués par les instituts.

La présidentielle de 2017 a marqué un regain de crédibilité pour les sondages qui ont permis d'annoncer relativement fidèlement l'ordre d'arrivée des 4 plus important des candidats, mais également leurs scores au premier tour. Le score de Marine Le Pen avait été légèrement surestimé dans les toutes dernières enquêtes (24 avril 2017) tandis que celui de Jean-Luc Mélenchon était légèrement sous-estimé.

En revanche, le score de Benoît Hamon du parti socialiste a été anticipé plus haut que le score effectivement réalisé : annoncé encore entre 7 et 8 points dans les dernières enquêtes du 24 avril 2017, il termine finalement la campagne avec un score de 6,36 %.

Une industrie sous influence ?

La réputation sulfureuse des sondages d'opinion et des sondages électoraux vient aussi du fait qu'ils sont suspectés de manipuler, sciemment ou non, l'opinion publique. En augmentant artificiellement la visibilité de certaines problématiques ou de certains candidats, les sondeurs pourraient ainsi influencer le résultat des élections.

Ce soupçon est d'autant plus renforcé ces dernières années que plusieurs grandes fortunes françaises ont fait leur entrée au capital de plusieurs instituts. À l'instar du paysage médiatique français, la mainmise des milliardaires français sur les sondeurs fait naître des craintes quant à leur utilisation à des fins politiques.

Cependant, même si tel était le dessin des plus grandes fortunes, les sciences sociales n'accordent pas grand crédit à l'hypothèse d'une manipulation de l'opinion par les sondages. L'effet d'entraînement de l'opinion publique par la mise en avant d'un candidat avant le premier tour, appelé effet « bandwagon » (effet de mode) est en réalité contrebalancé par l'effet « underdog » (effet de contradiction) qui conduirait certains électeurs indécis à soutenir le ou les candidats moins bien placés dans ce premier tour.

De plus, comme cela a déjà été évoqué, les sondages électoraux influencent la partie la plus politisée de la population, celle qui a le temps et l'envie de réfléchir aux problématiques politico-sociales. La pratique sociale qui consiste à consulter les résultats des sondages n'est pas une pratique majoritaire.

Conclusion

La méthode utilisée par les sondages d'opinion en France présente de nombreuses lacunes méthodologiques. Cependant, en raison de son coût moindre et de sa facilité d'exécution c'est la méthode par quota qui a fini par s'imposer.

Les sondages restent incapables de correctement prévoir le résultat du premier tour de la présidentielle s'ils sont réalisés plus de 2 à 3 mois avant les élections.

De plus, la montée de l'abstention et la difficulté de plus en plus grande des instituts de sondages à trouver des répondants (mise en place de récompenses pécuniaires) augmentent la difficulté pour les sondeurs à prévoir les résultats électoraux. Le risque pour les sondeurs est de ne plus réussir à interroger l'ensemble des strates de la société et à se retrouver avec des résultats aussi peu probants que les votes de pailles du Liberty Digest de 1936.

Photo d'ouverture : Arthimedes - @Shutterstock

elucid.media

documentaires