Muestra
Para la realización de una muestra hay que definir la población de referencia (a la que llamamos universo) y hacer una selección representativa de la misma (a la que llamamos muestra).
La población de referencia en los estudios del CIS es proporcionada por el Instituto Nacional de Estadística (INE) usando, hasta finales de febrero de 2025 (estudio 3498), datos del padrón de habitantes y, a partir de entonces, los del censo anual de población. El cambio es debido a que el INE ha dejado de elaborar la operación estadística del padrón continuo. Dichas fuentes nos aportan información de la población por las variables de sexo, municipio, nacionalidad y edad. Posteriormente, estos datos se transforman en los estratos de sexo, tramos de edad, tamaño de hábitat por comunidad autónoma utilizados en las encuestas.
El diseño muestral, es decir, la selección de personas que van a ser encuestadas, es crucial, ya que permite utilizar los datos obtenidos para describir y analizar a la población de la que ha sido extraída, el universo. Hay que tener en cuenta que en una muestra existe un margen de error, cuya magnitud se establece en la ficha técnica que acompaña a cada estudio y en la que se especifican todas las características técnicas.
Ponderación
La muestra se pondera realizando una comparación entre la composición de la muestra y una delineación adecuada del universo. Dicha delineación del universo es proporcionada por el Instituto Nacional de Estadística (INE). Sobre esta base, se aplica un procedimiento de ponderación nacional, utilizando ponderaciones marginales e intercelulares. De esta manera, se introducen en el procedimiento iterativo variables mínimas como sexo, edad, región NUTS II (regiones básicas definidas por la nomenclatura de unidades territoriales para estadísticas de EUROSTAT), nivel educativo (utilizando la clasificación de programas, titulaciones y certificaciones en niveles de formación alcanzados (CNED-A)) y tamaño de hábitat. Esta ponderación post-estratificación también se conoce como "ponderación de corrección" o "de no respuesta total".
El conjunto de datos del CIS proporciona siempre dos tipos de ponderaciones: una ponderación post-estratificación a nivel nacional (PESO) y una ponderación post-estratificación a nivel de comunidad autónoma (PESOCCAA). De acuerdo con el tamaño muestral, en algunos estudios también se ofrece una ponderación post-estratificación a nivel de provincia (PESOPROV).
Los valores medios de los coeficientes de la variable de post-estratificación a nivel nacional (PESO) se adjuntan al final de las fichas técnicas.
Para la estimación a nivel de cada comunidad autónoma, en el fichero de microdatos se incluye también la ponderación para cada una de ellas (variable PESOCCAA).
Échantillon
Pour créer un échantillon, vous devez définir la population de référence (que nous appelons l’univers) et faire une sélection représentative de cette population (que nous appelons l’échantillon).
La population de référence pour les études CIS est fournie par l'Institut national de la statistique (INE) à partir des données du registre de population, qui renseignent sur la population selon des variables telles que le sexe, la commune, la nationalité et l'âge. Ces données sont ensuite converties en strates par sexe, tranche d'âge et taille de commune par communauté autonome utilisées dans les enquêtes.
Le plan d'échantillonnage, c'est-à-dire la sélection des personnes interrogées, est crucial, car il permet d'utiliser les données obtenues pour décrire et analyser la population étudiée, l'univers. Il est important de garder à l'esprit qu'un échantillon comporte une marge d'erreur, dont l'ampleur est définie dans la fiche technique accompagnant chaque étude et qui précise toutes les caractéristiques techniques.
Pesée
L'échantillon est pondéré en comparant sa composition à une délimitation appropriée de la population échantillonnée. Cette délimitation est fournie par l'Institut national de la statistique (INE). Sur cette base, une procédure de pondération nationale est appliquée, utilisant des pondérations marginales et intercellulaires. Ainsi, des variables minimales telles que le sexe, l'âge, la région NUTS II (régions de base définies par la nomenclature des unités territoriales statistiques d'Eurostat), le niveau d'éducation (selon la classification des programmes, qualifications et certifications par niveaux d'éducation atteints (CNED-A)) et la taille de la localité sont introduites dans la procédure itérative. Cette pondération post-stratification est également appelée « pondération de correction » ou « pondération de non-réponse totale ».
L'ensemble de données du CIS propose toujours deux types de pondération : une pondération post-stratification au niveau national (PESO) et une pondération post-stratification au niveau des communautés autonomes (PESOCCAA). Selon la taille de l'échantillon, certaines études proposent également une pondération post-stratification au niveau provincial (PESOPROVINCIA).
Les valeurs moyennes des coefficients de la variable de post-stratification au niveau national (PESO) sont jointes à la fin des fiches techniques.
Pour l'estimation au niveau de chaque communauté autonome, le fichier de microdonnées comprend également la pondération pour chacune d'elles (variable PESOCCAA).