A base de datos do CIS traballa continuamente na preparación de documentación do estudo para a súa difusión.

Os estudos de nova creación están dispoñibles na páxina web institucional (www.cis.es) coa documentación completa unha vez que se completen as tarefas técnicas pertinentes de codificación, limpeza, validación e anonimización de datos, ademais da catalogación da información.

No caso de estudos máis antigos , aqueles dispoñibles nos arquivos da Institución con anterioridade ao ano 2000, os seus ficheiros de datos revísanse e elabóranse en orde cronolóxica descendente por ano de estudo ou por coleccións temáticas, de xeito que a súa documentación tamén estea totalmente dispoñible no sitio web. O CIS tamén traballa constantemente na modernización e ampliación dos formatos dos seus ficheiros de datos, avanzando no principio de neutralidade tecnolóxica e facilitando a súa xestión e comprensión por parte da comunidade investigadora e doutras persoas que desexen traballar con eles.

 

Acceso a ficheiros de datos

Para descargar os ficheiros de datos do CIS, primeiro debes completar un formulario. A información recollida é unicamente para o seu tratamento estatístico por parte da institución ou para notificar ao usuario, se procede, calquera cambio realizado nos datos do estudo solicitado.

Os ficheiros só se poden descargar individualmente, estudo por estudo; non é posible realizar descargas masivas.

 

Formato de ficheiro de datos

Os ficheiros de microdatos (matrices de datos) das enquisas do CIS, xunto coa documentación do estudo, descárganse nun ficheiro comprimido (MDxxxx.zip), que debe descomprimirse.

Este ficheiro contén os seguintes ficheiros, que son necesarios para a explotación do estudo:

  • Documentación:
    • Cuestionario (cuestionarioxxxx). En formato PDF
    • Ficha técnica (Ftxxxx). En formato PDF
    • Libro de códigos (codexxxx). En formato PDF
    • Tarxetas (tarxetasxxxx). En formato PDF (só para enquisas realizadas mediante entrevista presencial)
  • Ficheiro de microdatos anonimizado (DAxxxx) en formato ASCII. (Vexa as seccións "Formato de ficheiro de datos - ASCII" e "Anexo I")
  • Programa de sintaxe de lectura de ficheiros de microdatos para traballar con SPSS (ESxxxx). En formato ASCII. (Vexa a sección "Formato de ficheiro de sintaxe de SPSS" e o "Anexo I")
  • Outros tipos de ficheiros que tamén poden conter:
    • Ficheiro de datos en formato SPS (xxxx.sav). Dispoñible para estudos cuxos datos foron preparados desde 2018 (inclúe estudos de calquera data).
    • Ficheiro de datos en formato CSV , con e sen etiquetas (xxxx_etiq.csv, xxxx_num.csv). Dispoñible para estudos cuxos datos foron preparados desde 2023 (inclúe estudos de calquera data).
    • Programa de sintaxe de lectura de ficheiros de microdatos para traballar con SAS (Sasxxxx). En formato ASCII. Só dispoñible para estudos realizados entre xaneiro de 2009 e novembro de 2013 (consulte a sección "Formato de ficheiro de sintaxe SAS").

Cando o estudo ten varios documentos do mesmo tipo (por exemplo, máis dun cuestionario, máis dunha ficha informativa, etc.), estes adoitan incluírse nun ficheiro comprimido. Os microdatos, dependendo do seu tamaño en bytes, tamén poden comprimirse.

 

Formato de ficheiro de datos - ASCII

Os ficheiros de datos do CIS ofrécense en formato ASCII (formato de texto) e pódense procesar con calquera programa estatístico como SPSS, SAS, etc.

Un ficheiro de microdatos aparece como unha matriz de números, onde as filas ou rexistros corresponden aos entrevistados e as columnas ás respostas dadas a cada variable. As columnas asignadas a cada variable pódense atopar no libro de códigos ou no cuestionario, se se implementou en papel (PAPI), onde se indican cun número entre parénteses á dereita das categorías de resposta.

Anteriormente, o número de columnas da matriz limitábase a 80, polo que se empregaban tantas filas como fosen necesarias para completar a información de cada entrevistado. Cada fila de 80 columnas corresponde a unha TARXETA DE REXISTRO. O cambio dunha tarxeta a outra indícase no cuestionario. A partir do estudo núm. 2083 (febreiro de 1994), os cuestionarios do CIS xa non se estruturan mediante tarxetas e a información de cada entrevista rexístrase nunha soa liña. Ambos formatos (con ou sen REXISTROS) coexisten nos ficheiros de microdatos proporcionados polo CIS.

Os microdatos son anonimizados para evitar a identificación individual dos entrevistados. As variables afectadas neste proceso dependen do estudo específico, pero xeralmente son: entrevistador, sección, distrito e concellos con menos de 100.000 habitantes (agás capitais de provincia ou comunidade autónoma).

Os datos que conteñan variables de ponderación (WEIGHT) terán unha coma (,) como separador decimal. Isto téñense en conta ao traballar en ordenadores con configuracións rexionais diferentes. Ademais, un mesmo estudo pode ter máis dunha variable de ponderación.

Para usar este formato de ficheiro, lea as instrucións do Apéndice.

 

Formato de ficheiro de datos - SAV

A extensión de ficheiro .sav é o ficheiro de datos para o programa de análise estatística IBM SPSS. Os datos xa están procesados e listos para traballar con eles directamente desde a aplicación.

Os datos que conteñan variables de ponderación (WEIGHT) terán unha coma (,) como separador decimal. Isto téñense en conta ao traballar en ordenadores con configuracións rexionais diferentes. Ademais, un mesmo estudo pode ter máis dunha variable de ponderación.

No caso de que os datos dun estudo requiran axuste, proporcionaranse ponderados pola variable que contén os coeficientes de ponderación da mostra principal, normalmente chamada WEIGHT.

 

Formato de ficheiro de datos - CSV

CSV significa "valores separados por comas". É un formato aberto.

Estes ficheiros de texto teñen o aspecto de táboas onde as filas corresponden ás persoas entrevistadas e as columnas ás variables.

A forma máis común de ler estes ficheiros é usar o programa Excel.

Ofrécense en 2 versións:

  • con etiquetas de nomes de variables e categorías de resposta ( xxxx_etiq.csv )
  • sen etiqueta, é dicir, numérico ( xxxx_num.csv )

Os datos que conteñan variables de ponderación (WEIGHT) terán unha coma (,) como separador decimal. Isto téñense en conta ao traballar en ordenadores con configuracións rexionais diferentes. Ademais, un mesmo estudo pode ter máis dunha variable de ponderación.

 

Formato de ficheiro de sintaxe - SPSS

O ficheiro de sintaxe preséntase en formato ASCII, pero está deseñado para funcionar co programa de procesamento estatístico SPSS.

Contén, como mínimo, os comandos mínimos necesarios para ler correctamente os microdatos: a definición de variables (DATA LIST) e a ponderación (WEIGHT) cando o deseño da mostra o require.

É posible que non se inclúan outros comandos de SPSS, como as etiquetas de variables (ETIQUETAS DE VARIABLES) e as categorías de resposta (ETIQUETAS DE VALORES), e comandos como RECODIFICAR, VALORES PERDIDOS, FRECUENCIAS, etc. En ocasións, as etiquetas de variables (ETIQUETAS DE VARIABLES) poden aparecer só para variables multicompoñente (multivariables, multirespostas e multidicotómicas). Os estudos máis recentes ou procesados recentemente conteñen a sintaxe completa.

Os coeficientes de ponderación adoitan detallarse na folla de datos, aínda que ás veces só se inclúen no ficheiro de microdatos. Se un estudo require máis dunha variable de ponderación (por exemplo, PESO e PESOCCAA), só se deixa activa a principal, ou a que afecta á mostra global.

Para as enquisas realizadas entre 1992 e 1997, o programa de sintaxe pode estar escrito en versións antigas de SPSS, concretamente en UNIX, que manexa a sintaxe de forma algo diferente ás versións máis recentes. Nestes casos, as instrucións que se atopan enriba da LISTA DE DATOS deberían eliminarse ou, polo menos, non executarse, e deberían engadirse terminadores de comando, que poden ser un punto (.) ou unha liña en branco, para separar as instrucións.

Para usar este formato de ficheiro, lea as instrucións do Apéndice.

 

Formato de ficheiro de sintaxe - SAS

O ficheiro de sintaxe preséntase en formato ASCII, pero está deseñado para funcionar co programa de procesamento estatístico SAS.

Como mínimo, contén as instrucións necesarias para a lectura correcta dos microdatos. Outras instrucións que aparecen no programa son as que etiquetan as variables e as categorías de resposta.

Este formulario xa non está dispoñible e só o está para algúns estudos realizados entre xaneiro de 2009 e novembro de 2013.