Comparer les données d'enquêtes électorales françaises à grande échelle

Diffuseur d’une grande partie des enquêtes électorales françaises produites depuis 1958, le CDSP a développé une base de questions et de variables harmonisées de cette collection afin de faciliter les possibilités d’études comparatives par la communauté de la recherche.

As the structure that has disseminated a large proportion of the French electoral surveys produced since 1958, CDSP has developed a database of questions and harmonised variables from this collection in order to facilitate opportunities for comparative studies by the research community.

La collection des enquêtes électorales du CDSP regroupe 25 enquêtes pré et post-électorales françaises produites entre 1958 et 2022. Fortement utilisées par la communauté académique, leur richesse et leur hétérogénéité ont motivé un travail de post-harmonisation. Au total, ce sont plus de 2500 variables issues de 11 enquêtes électorales de référence qui sont regroupées dans une base de métadonnées commune couvrant les élections françaises de la Ve République.

Harmoniser des données hétérogènes

Pour la conduite de ces opérations de curation, Malo JAN et Lucie MARIE se sont appuyés sur la norme et la classification conceptuelle développées dans le cadre du projet européen True European Voter ainsi que sur le modèle de “variable cascade” du standard DDI-L pour la production de métadonnées.

Les variables des 11 enquêtes de référence concordantes ont été associées manuellement à un concept de la nomenclature TEV. Par réciprocité, les questions ou variables analogues de différentes sources sont alors aisément identifiables sous un même concept et ne sont plus spécifiques à un jeu de données.

En rendant facilement trouvables l’information (nom de la variable, question, catégorie) sur les données équivalentes, à travers une arborescence regroupant les principaux concepts de l’étude des comportements électoraux, ce lissage permet une comparabilité historique des opinions et des comportements électoraux en France.

The CDSP’s collection of electoral surveys consists of 25 pre- and post-electoral surveys produced between 1958 and 2022. Heavily used by the academic community, their richness and heterogeneity have prompted an exercise of post-harmonisation. In all, more than 2500 variables drawn from 11 benchmark electoral surveys are grouped within a common database of metadata covering French elections during the fifth Republic.

Harmonising heterogeneous data

In order to carry out these exercises in curatorship, Malo JAN and Lucie MARIE drew on the standard and conceptual classification developed for the European True European Voter project together with the “variable cascade” model in the DDI-L standard for the production of metadata.

The variables in the 11 corresponding benchmark surveys were manually linked with a concept from the TEV nomenclature. In return, similar questions or variables from different sources can then be easily combined under a single concept and are no longer specific to a particular dataset.

By making it easy to find the information (variable name, question, category) on equivalent data, through a tree structure that brings together the main concepts of the survey on electoral behaviours, this smoothing process makes it possible to conduct historical comparisons of electoral opinions and behaviours in France.

Contribuer aux ressources de l’European Question Bank

L’entrée des données du CDSP à la plateforme explore.cdsp.sciences-po permettra d’accroître les possibilités de comparaisons entre des données internationales et leur utilisation à plus grande échelle.

Moissonnée par l’European Question Bank du CESSDA, cette plateforme issue du second volet du projet UpMet est dédiée à l’exploration d'enquêtes longitudinales ou comparées.

Contributing to the resources of the European Question Bank

Entering CDSP data on the explore.cdsp.sciences-po platform will increase possibilities for comparing international data and using them at a larger scale..

Harvested by CESSDA’s European Question Bank, this platform, which emerged from the second phase of the UpMet project is dedicated to the exploration of longitudinal or comparative surveys.

Entering CDSP data on the explore.cdsp.sciences-po platform will increase possibilities for comparing international data and using them at a larger scale..

Harvested by CESSDA’s European Question Bank, this platform, which emerged from the second phase of the UpMet project is dedicated to the exploration of longitudinal or comparative surveys.