Muestra y ponderación
Muestra
Para la realización de una muestra hay que definir la población de referencia (a la que llamamos universo) y hacer una selección representativa de la misma (a la que llamamos muestra).
La población de referencia en los estudios del CIS es proporcionada por el Instituto Nacional de Estadística (INE) usando, hasta finales de febrero de 2025 (estudio 3498), datos del padrón de habitantes y, a partir de entonces, los del censo anual de población. El cambio es debido a que el INE ha dejado de elaborar la operación estadística del padrón continuo. Dichas fuentes nos aportan información de la población por las variables de sexo, municipio, nacionalidad y edad. Posteriormente, estos datos se transforman en los estratos de sexo, tramos de edad, tamaño de municipio por comunidad autónoma utilizados en las encuestas.
El diseño muestral, es decir, la selección de personas que van a ser encuestadas, es crucial, ya que permite utilizar los datos obtenidos para describir y analizar a la población de la que ha sido extraída, el universo. Hay que tener en cuenta que en una muestra existe un margen de error, cuya magnitud se establece en la ficha técnica que acompaña a cada estudio y en la que se especifican todas las características técnicas.
Ponderación
La muestra se pondera realizando una comparación entre la composición de la muestra y una delineación adecuada del universo. Dicha delineación del universo es proporcionada por el Instituto Nacional de Estadística (INE). Sobre esta base, se aplica un procedimiento de ponderación nacional, utilizando ponderaciones marginales e intercelulares. De esta manera, se introducen en el procedimiento iterativo variables mínimas como sexo, edad, región NUTS II (regiones básicas definidas por la nomenclatura de unidades territoriales para estadísticas de EUROSTAT), nivel educativo (utilizando la clasificación de programas, titulaciones y certificaciones en niveles de formación alcanzados (CNED-A)) y tamaño de la localidad. Esta ponderación post-estratificación también se conoce como 'ponderación de corrección' o 'de no respuesta total'.
El conjunto de datos del CIS proporciona siempre dos tipos de ponderaciones: una ponderación post-estratificación a nivel nacional (PESO) y una ponderación post-estratificación a nivel de comunidad autónoma (PESOCCAA). De acuerdo con el tamaño muestral, en algunos estudios también se ofrece una ponderación post-estratificación a nivel provincia (PESOPROVINCIA).
Los valores medios de los coeficientes de la variable de post-estratificación a nivel nacional (PESO) se adjuntan al final de las fichas técnicas.
Para la estimación a nivel de cada comunidad autónoma, en el fichero de microdatos se incluye también la ponderación para cada una de ellas (variable PESOCCAA).