Objet: Distribution territoriale (suite)
En 2022, le Thiase a posé comme question additionnelle si son sondage de recensement était répondu pour la première fois (Panel constitué en 2022) ou si la participation au sondage était une nouvelle itération. Considérant que les échantillons départementaux ayant déjà répondu en 2010, 2014 ou 2018 rentraient dans le cadre d’une étude longitudinale, visant à recontacter par e-mailing (tous les 4 ans) les échantillons déjà préalablement constitués, alors nous pouvons considérer que les rôlistes qui avaient déjà répondu constituent un groupe de référence en 2022.
Ainsi, il est pertinent de tester la corrélation de l’échantillon de référence interrogé en 2022 avec la cartographie réalisée en 2014 (points bleus ci-dessous). Puis comparer cette corrélation avec la distribution départementale déductible du Panel 2022 (points verts ci-dessous). Considérant l’hypothèse, illustrée par un trait noir continu, selon laquelle la distribution 2022 pourrait être identique à celle de 2014.
Détails statistiques
Le graphique ci-dessus illustre par un trait bleu pointillé la corrélation linéaire positive et significative entre la distribution départementale de référence, constituée en 2014 par le Thiase et sa réévaluation par l’itération 2022 (r(99)=0.948, p<0.001). Ce qui démontre à la fois, d’une part la similitude significative et représentable par une modélisation linéaire, d’autre part la dispersion stochastique inévitable de ce type de données, lorsque la mesure 2014 a été répétée en 2022. Cette dispersion s’avère susceptible d’être si importante pour chaque département qu’elle pourrait masquer les évolutions susceptibles d’être survenues par les déplacements géographiques entre 2014 et 2022. D’autant plus qu’il y a très peu d’écart entre la modélisation linéaire de ce groupe de référence et l’hypothèse d’identicité géographique. Du fait que ce type de modélisation linéaire reste très dépendant des valeurs extrêmes (ici le top 12 préalablement cité).
De plus, cette illustration met en exergue en trait vert pointillé la corrélation linéaire positive qui existe aussi entre les échantillons départementaux, constitués en 2014 par le Thiase et la distribution d’un groupe de participations distinctes: le Panel constitué en 2022 (r(99)=0.929, p<0.001). Quoi que moindre (R²=0.86 au lieu de 0.90), cette corrélation reste également significative, en outre elle est du même ordre de grandeur que la comparaison des données recueillies par la FFJdR, lorsque corrélées avec les données réunies par le Thiase ou avec les données de l’INSEE.
Enfin, en l’état actuel de la présentation de ces données, l’écart entre l’hypothèse d’identicité et la parfaite correspondance des modélisation linéaires des deux groupes interrogés pourrait être interprété comme un phénomène de dispersion susceptible d’impacter les données départementales de 2014. Donc nous invitons notre lectorat à ne pas tirer une conclusion trop hâtive sur ce point pour confirmer ou non l’hypothèse proposée. Nous présenterons ultérieurement une autre méthode, plus rigoureuse.
La description globale de cette illustration permet de mettre en exergue le phénomène de dispersion inévitable, lorsqu’une mesure est répétée: la distribution départementale du Panel 2022 et du groupe de référence 2014 ont tous les deux une dispersion importante, c’est-à-dire un nuage de points très étendu autour de leurs modélisations linéaires respectives, à savoir les traits pointillés qui représentent la corrélation voire éventuellement l’évolution survenue entre 2014 et 2022
Considérés collectivement, la description de cette dispersion est alternativement explicable de la manière suivante, volontairement simplifiée pour présenter ici un propos pédagogique concernant la variabilité des mesures: chaque abscisse dispose d’une ordonnée bleu et d’une ordonnée verte et l’écart important de ces deux ordonnées démontre à quel point la mesure de la distribution départementale est une évaluation potentiellement imprécise. Cette imprécision est notamment due à l’éthique liée au traitement des données: les rôlistes qui ont répondu au Thiase ne sont pas identifiables de manière individuelle, mais analysés comme plusieurs échantillons départementaux, dont les dimensions fluctuent d’une itération à l’autre, sans contrôle stricte des flux départementaux ni respect stricte de la réitération, par tous les répondants du sondage 2014.
En effet, sur 4143 répondants en 2014, seulement 1560 ont constitué le groupe de référence 2022. Alors que les observations recueillies par le Thiase lors des éditions précédentes (et renouvelées en 2022 mais pas encore rapportées ici) démontrent qu’une forte proportion de répondants pratiquent le JdR depuis les années antérieures à 2000. Réciproquement, ce constat valorise le nouveau Panel constitué en 2022: 1754 participant au sondage 2022 du Thiase ont déclaré ne pas avoir participé à l’un des précédents recensements de population (ni 2010, ni 2014, ni 2018). Ainsi, le Panel nouvellement constitué en 2022 est majoritaire parmi les participations recueillies en 2022 par le Thiase. Et une étude comparative de ce Panel, confronté au groupe de Référence 2022, est pertinente avant d’établir une comparaison plus avancée du Thiase avec les résultats de l’enquête CNL.
En conclusion, le phénomène de dispersion illustré ici est manifestement imputable à un faible taux d’itération de la population rôliste à l’appel répété de recensement par le Thiase. Ce qui complique significativement l’étude de la distribution territoriale, malgré la tentative remarquable de promouvoir l’intérêt d’une étude longitudinale, afin de minimiser ce phénomène de dispersion grâce à la répétabilité des mesures. Réciproquement, il faut considérer que le phénomène de dispersion est inévitablement présent avec ampleur comparable dans le sondage de la Fédération, parce que le nombre de participation (2857) est une dimension comparable au groupe de Référence 2022 et au Panel 2022 du Thiase, justifiant la nécessité de ne pas négliger la dispersion stochastique. Ainsi, il convient dorénavant de prendre sérieusement en compte ce phénomène, dans les méthodes d’analyse des données territoriales.