mercredi 29 avril 2009

Sondage sur les élections européennes : de nouveaux chiffres mais les mêmes résultats...


Un nouveau sondage vient de tomber sur les intentions de vote des Français aux prochaines élections européennes. Celui-ci a été réalisé par l’IFOP entre le 23 et le 24 avril. Les chiffres obtenus sur un échantillon de 853 personnes interrogées sont les suivants :

UMP : 26,5 % des intentions de vote
PS : 22,5 %
MoDem : 14,0 %
Europe Ecologie : 7,5 %
FN : 7,5 %
NPA : 7,0 %
Front de gauche : 5,5 %
Libertas : 5,0 %
LO : 3,0 %

En fait, malgré les apparences, ces résultats sont parfaitement comparables à ceux des deux autres sondages déjà signalés (cf. les articles ci-dessous). Pour l’expliquer, il me faut faire un peu de théorie statistique…

Un sondage consiste à interroger un « petit » groupe de personnes et à extrapoler leurs réponses en les considérant comme représentatives de celles de la population totale. En réalité, dès que l’on fait une telle extrapolation, on introduit une marge d’erreur. C’est un peu comme de prendre la température d’un verre d’eau pour évaluer celle de la baignoire ou de l’étang dont cette eau provient…. En fait, toute la question est de savoir quelle est la probabilité que la « vraie » réponse (celle de la population entière) soit à peu près la même que celle de l’échantillon qu’on a interrogé. On sent bien que, plus l’échantillon est grand, plus le risque d’erreur est faible. En interrogeant une seule personne, on a risque important de se tromper ; en interrogeant la population entière, on a un risque nul.

En termes statistiques, cela se traduit par la notion « d’intervalle de confiance à x% ». Concrètement, cela veut dire que, pour une réponse « R% » donnée par l’échantillon et un intervalle de (par exemple) ±2%, la « véritable » réponse (celle de la population) a x% de chances d’être située quelque part entre (R-2)% et (R+2)%.

Le plus souvent, pour un sondage, les statisticiens s’intéressent à un intervalle de confiance à 95%. Dans ce cas, si la réponse de l’échantillon est « 14% » et si l’intervalle est de ±2%, il y a 95 chances sur 100 que la « vraie » réponse soit comprise entre 12% et 16%.

Et comme on l’a vu, la variation de l’intervalle est d’autant plus grande que la taille de l’échantillon est petite.

Pour les curieux, voici une formule approchée du calcul d'un intervalle de confiance à 95% :

[vi ; vs] = vo ± 1,96 x RC(vo x (1-vo)/N) avec

vi = valeur inférieure de l’intervalle
vs = valeur supérieure de l’intervalle
vo = valeur observée
N = taille de l’échantillon
RC = « racine carrée de… »

Par exemple, dans ce sondage, on a interrogé 853 personnes et le MoDem a été crédité de 14% d’intentions de vote. Si on applique la formule, on trouve que la vraie réponse a 95% de chances d’être située entre 11,7% et 16,3%. En d’autres termes, pour cet échantillon de 853 personnes, tous les chiffres compris entre 11,7 et 16,3 se valent !

Quant aux 26,5% dont est crédité l’UMP, le « vrai » chiffre se promène (avec une certitude de 95%) quelque part entre 23,5% et 29,5%... Détail amusant : suivant la même formule, le 22,5% du PS a 95% de chances de refléter un chiffre situé quelque part entre 19,7% et 25,3%. Ce qui veut dire que, dans la réalité TELLE QUE LA DECRIT CE SONDAGE, le PS pourrait bien avoir obtenu un meilleur score que l'UMP !

On voit que cette histoire d'intervalle de confiance est loin d'être secondaire... C’est pourquoi je disais que, malgré des différences apparentes, les trois sondages de ces derniers mois donnent en réalité des résultats comparables.

Par ailleurs, il faut savoir que les instituts de sondage ne rapportent pas, dans les sondages politiques, les réponses exactes qu’ils ont recueillies. Pour certaines réponses (par exemple, les intentions de vote FN), ils prennent en compte les « fausses déclarations » et les « redressent » suivant des formules qu’ils gardent secrètes… et qui varient d’un institut à l’autre. C’est ainsi que les mêmes données brutes, recueillies par deux instituts différents, pourront donner lieu à la publication de chiffres différents. Cela peut suffire à expliquer les résultats différents dont sera crédité le FN (ou le NPA, par exemple) dans deux sondages effectués par deux instituts différents sur des échantillons similaires au cours de la même période.

Moralité : lorsque vous lisez les résultats d’un sondage, gardez bien à l’esprit cette notion d’intervalle de confiance et rappelez-vous qu’une évolution de 2 à 3 points en plus ou en moins n’est pas forcément significative !


Ch. Romain

.

Aucun commentaire: