La base de données CIS travaille en permanence à la préparation de la documentation d'étude en vue de sa diffusion.

Les études nouvellement créées sont disponibles sur le site Web institutionnel (www.cis.es) avec une documentation complète une fois les tâches techniques pertinentes de codage, de nettoyage, de validation et d'anonymisation des données, ainsi que le catalogage des informations, terminées.

Pour les études plus anciennes , celles disponibles dans les archives de l'Institution avant 2000, leurs fichiers de données sont examinés et préparés par ordre chronologique décroissant, par année d'étude ou par collections thématiques, afin que leur documentation soit également intégralement disponible sur le site web. Le CIS travaille également en permanence à la modernisation et à l'enrichissement des formats de ses fichiers de données, en promouvant le principe de neutralité technologique et en facilitant leur gestion et leur compréhension par la communauté scientifique et les autres personnes souhaitant les exploiter.

 

Accès aux fichiers de données

Pour télécharger les fichiers de données du CIS, vous devez d'abord remplir un formulaire. Les informations recueillies sont uniquement destinées au traitement statistique par l'établissement ou, le cas échéant, à informer l'utilisateur de toute modification apportée aux données de l'étude demandée.

Les fichiers ne peuvent être téléchargés qu'individuellement, étude par étude ; les téléchargements en masse ne sont pas possibles.

 

Format du fichier de données

Les fichiers de microdonnées (matrices de données) des enquêtes du CIS, ainsi que la documentation de l'étude, sont téléchargés dans un fichier compressé (MDxxxx.zip), qui doit être décompressé.

Ce dossier contient les fichiers suivants, nécessaires à l'exploitation de l'étude :

  • Documentation:
    • Questionnaire (questionnairexxxx). Au format PDF.
    • Fiche technique (Ftxxxx). Au format PDF.
    • Livre de codes (codexxxx). Au format PDF.
    • Cartes (cardsxxxx). Au format PDF (uniquement pour les enquêtes menées en personne)
  • Fichier de microdonnées anonymisées (DAxxxx) au format ASCII. (Voir les sections « Format du fichier de données - ASCII » et « Annexe I »)
  • Programme de syntaxe de lecture de fichiers de microdonnées pour SPSS (ESxxxx). Au format ASCII. (Voir la section « Format de fichier de syntaxe SPSS » et l'« Annexe I »)
  • Autres types de fichiers pouvant également contenir :
    • Fichier de données au format SPS (xxxx.sav). Disponible pour les études dont les données ont été préparées depuis 2018 (inclut les études de toute date).
    • Fichier de données au format CSV , avec et sans étiquettes (xxxx_etiq.csv, xxxx_num.csv). Disponible pour les études dont les données ont été préparées depuis 2023 (inclut les études de toute date).
    • Programme de syntaxe de lecture de fichiers de microdonnées pour travailler avec SAS (Sasxxxx). Au format ASCII. Disponible uniquement pour les études menées entre janvier 2009 et novembre 2013 (voir la section « Format de fichier de syntaxe SAS »).

Lorsque l'étude comporte plusieurs documents du même type (par exemple, plusieurs questionnaires, plusieurs fiches d'information, etc.), ceux-ci sont généralement inclus dans un fichier compressé. Les microdonnées, selon leur taille en octets, peuvent également être compressées.

 

Format de fichier de données - ASCII

Les fichiers de données CIS sont fournis au format ASCII (format texte) et peuvent être traités avec n'importe quel programme statistique tel que SPSS, SAS, etc.

Un fichier de microdonnées se présente sous la forme d'une matrice de nombres, où les lignes ou enregistrements correspondent aux personnes interrogées et les colonnes aux réponses données à chaque variable. Les colonnes attribuées à chaque variable se trouvent dans le manuel de codage ou dans le questionnaire, s'il a été mis en œuvre sur papier (PAPI), où elles sont indiquées par un numéro entre parenthèses à droite des catégories de réponse.

Auparavant, le nombre de colonnes de la matrice était limité à 80 ; on utilisait donc autant de lignes que nécessaire pour compléter les informations de chaque personne interrogée. Chaque ligne de 80 colonnes correspond à une FICHE D'ENREGISTREMENT. Le passage d'une fiche à l'autre est indiqué sur le questionnaire. Depuis l'étude n° 2083 (février 1994), les questionnaires de l'ECI ne sont plus structurés par fiches, et les informations de chaque entretien sont enregistrées sur une seule ligne. Les deux formats (avec ou sans ENREGISTREMENTS) coexistent dans les fichiers de microdonnées fournis par l'ECI.

Les microdonnées sont anonymisées afin d'empêcher l'identification individuelle des personnes interrogées. Les variables concernées par ce processus dépendent de l'étude spécifique, mais sont généralement : l'enquêteur, la section, le district et les communes de 100 000 habitants ou moins (à l'exception des capitales provinciales ou des communautés autonomes).

Les données contenant des variables de pondération (POIDS) seront séparées par une virgule (,) comme séparateur décimal. Ceci est pris en compte lors de l'utilisation d'ordinateurs avec des paramètres régionaux différents. De plus, une même étude peut comporter plusieurs variables de pondération.

Pour utiliser ce format de fichier, veuillez lire les instructions en annexe.

 

Format de fichier de données - SAV

L'extension de fichier .sav correspond au fichier de données du programme d'analyse statistique IBM SPSS. Les données sont déjà traitées et prêtes à être exploitées directement depuis l'application.

Les données contenant des variables de pondération (POIDS) seront séparées par une virgule (,) comme séparateur décimal. Ceci est pris en compte lors de l'utilisation d'ordinateurs avec des paramètres régionaux différents. De plus, une même étude peut comporter plusieurs variables de pondération.

Dans le cas où les données d'une étude nécessitent un équilibrage, elles seront fournies pondérées par la variable qui contient les coefficients de pondération de l'échantillon principal, généralement appelés WEIGHT.

 

Format de fichier de données - CSV

CSV signifie « Comma Separated Values ». C'est un format ouvert.

Ces fichiers texte ressemblent à des tableaux où les lignes correspondent aux personnes interrogées et les colonnes correspondent aux variables.

La manière la plus courante de lire ces fichiers est d’utiliser le programme Excel.

Ils sont proposés en 2 versions :

  • avec des étiquettes de noms variables et des catégories de réponses ( xxxx_etiq.csv )
  • sans étiquette, c'est-à-dire numérique ( xxxx_num.csv )

Les données contenant des variables de pondération (POIDS) seront séparées par une virgule (,) comme séparateur décimal. Ceci est pris en compte lors de l'utilisation d'ordinateurs avec des paramètres régionaux différents. De plus, une même étude peut comporter plusieurs variables de pondération.

 

Format de fichier de syntaxe - SPSS

Le fichier de syntaxe est présenté au format ASCII, mais est conçu pour fonctionner avec le programme de traitement statistique SPSS.

Il contient, au moins, les commandes minimales nécessaires à la lecture correcte des microdonnées : la définition des variables (DATA LIST) et la pondération (WEIGHT) lorsque le plan d'échantillonnage l'exige.

D'autres commandes SPSS peuvent ne pas être incluses, telles que les libellés de variables (ÉTIQUETTES DE VARIABLES) et les catégories de réponses (ÉTIQUETTES DE VALEURS), ainsi que des commandes telles que RECODER, VALEURS MANQUANTES, FRÉQUENCES, etc. Il arrive que les libellés de variables (ÉTIQUETTES DE VARIABLES) n'apparaissent que pour les variables multicomposantes (multivariées, multiréponses et multidichotomiques). Les études plus récentes ou traitées contiennent la syntaxe complète.

Les coefficients de pondération sont généralement détaillés dans la fiche de données, bien qu'ils soient parfois inclus uniquement dans le fichier de microdonnées. Si une étude nécessite plusieurs variables de pondération (par exemple, PESO et PESOCCAA), seule la variable principale, ou celle qui affecte l'échantillon global, reste active.

Pour les enquêtes menées entre 1992 et 1997, le programme syntaxique peut avoir été écrit dans d'anciennes versions de SPSS, notamment UNIX, qui gère la syntaxe différemment des versions plus récentes. Dans ce cas, les instructions situées au-dessus de la LISTE DE DONNÉES doivent être supprimées, ou du moins non exécutées, et des terminateurs de commande, qui peuvent être un point (.) ou une ligne vide, doivent être ajoutés pour séparer les instructions.

Pour utiliser ce format de fichier, veuillez lire les instructions en annexe.

 

Format de fichier de syntaxe - SAS

Le fichier de syntaxe est présenté au format ASCII, mais est conçu pour fonctionner avec le programme de traitement statistique SAS.

Il contient au minimum les instructions nécessaires à la lecture correcte des microdonnées. Le programme contient également des instructions qui identifient les variables et les catégories de réponses.

Ce formulaire n'est plus disponible et n'est disponible que pour certaines études menées de janvier 2009 à novembre 2013.