Échantillon et pondération

Échantillon

Pour créer un échantillon, vous devez définir la population de référence (que nous appelons l’univers) et faire une sélection représentative à partir de celle-ci (que nous appelons l’échantillon).

La population de référence pour les études CIS est fournie par l'Institut national de la statistique (INE), à partir des données du registre de population jusqu'à fin février 2025 (étude 3498) et, par la suite, des données du recensement annuel de la population. Ce changement est dû à l'arrêt du recensement continu par l'INE. Ces sources fournissent des informations démographiques basées sur les variables de sexe, de commune, de nationalité et d'âge. Ces données sont ensuite transformées en strates de sexe, de tranches d'âge et de taille de commune par communauté autonome utilisées dans les enquêtes.

Le plan d'échantillonnage, c'est-à-dire la sélection des personnes à interroger, est crucial, car il permet d'utiliser les données obtenues pour décrire et analyser la population dont elles sont issues, l'univers. Il est important de garder à l'esprit qu'un échantillon comporte une marge d'erreur, dont l'ampleur est définie dans la fiche technique qui accompagne chaque étude et qui précise toutes les caractéristiques techniques.

Pesée

L'échantillon est pondéré en comparant sa composition à une délimitation appropriée de la population échantillonnée. Cette délimitation est fournie par l'Institut national de la statistique (INE). Sur cette base, une procédure de pondération nationale est appliquée, utilisant des pondérations marginales et intercellulaires. Ainsi, des variables minimales telles que le sexe, l'âge, la région NUTS II (régions de base définies par la nomenclature Eurostat des unités territoriales statistiques), le niveau d'éducation (selon la classification des programmes, qualifications et certifications par niveaux d'éducation atteints (CNED-A)) et la taille de la localité sont introduites dans la procédure itérative. Cette pondération post-stratification est également appelée « pondération de correction » ou « pondération de non-réponse totale ».

L'ensemble de données du CIS propose toujours deux types de pondération : une pondération post-stratification au niveau national (PESO) et une pondération post-stratification au niveau des communautés autonomes (PESOCCAA). Selon la taille de l'échantillon, certaines études proposent également une pondération post-stratification au niveau provincial (PESOPROVINCIA).

Les valeurs moyennes des coefficients de la variable de post-stratification au niveau national (PESO) sont jointes à la fin des fiches techniques.

Pour l'estimation au niveau de chaque communauté autonome, le fichier de microdonnées comprend également la pondération pour chacune d'elles (variable PESOCCAA).