CIS Datu-baseak etengabe ari da lanean ikerketa-dokumentazioa prestatzen zabaltzeko.

Ikerketa berriak erakundearen webgunean daude eskuragarri (www.cis.es), dokumentazio osoarekin , datuak kodetzeko, garbitzeko, balioztatzeko eta anonimizatzeko zeregin tekniko garrantzitsuak, informazioa katalogatzeaz gain, amaitu ondoren.

2000. urtea baino lehen Erakundearen artxiboetan eskuragarri dauden ikerketa zaharren kasuan, haien datu-fitxategiak berrikusi eta prestatzen dira ikasketa-urtearen edo gai-bildumaren arabera ordena kronologiko beherakorrean, haien dokumentazioa webgunean ere osorik eskuragarri egon dadin. CISek etengabe lanean dihardu bere datu-fitxategien formatuak modernizatzen eta zabaltzen, neutraltasun teknologikoaren printzipioa sustatuz eta ikerketa-komunitateak eta haiekin lan egin nahi dutenek haien kudeaketa eta ulermena erraztuz.

 

Datu-fitxategietarako sarbidea

CIS datu-fitxategiak deskargatzeko, lehenik formulario bat bete behar duzu. Bildutako informazioa erakundeak prozesatzeko estatistikarako edo, hala badagokio, eskatutako ikerketan datuetan egindako aldaketak erabiltzaileari jakinarazteko soilik da.

Fitxategiak banaka bakarrik deskargatu daitezke, ikasketaz ikasketa; deskarga masiboak ezinezkoak dira.

 

Datu fitxategiaren formatua

CIS inkestetako mikrodatuen fitxategiak (datu-matrizeak), ikerketaren dokumentazioarekin batera, fitxategi konprimitu batean deskargatzen dira (MDxxxx.zip), eta deskonprimitu egin behar da.

Fitxategi honek ikerketaren ustiapenerako beharrezkoak diren fitxategi hauek ditu:

  • Dokumentazioa:
    • Galdetegia (galdetegiaxxxx). PDF formatuan
    • Fitxa teknikoa (Ftxxxx). PDF formatuan
    • Kode-liburua (codexxxx). PDF formatuan
    • Txartelak (txartelakxxxx). PDF formatuan (aurrez aurreko elkarrizketa bidez egindako inkestetarako soilik)
  • Mikrodatuen fitxategi anonimizatua (DAxxxx) ASCII formatuan. (Ikusi 'Datu fitxategiaren formatua - ASCII' eta 'I. eranskina' atalak)
  • SPSSrekin lan egiteko mikrodatuen fitxategiak irakurtzeko sintaxi programa (ESxxxx). ASCII formatuan. (Ikusi 'SPSS Sintaxi Fitxategiaren Formatua' eta 'I. Eranskina' atalak)
  • Beste fitxategi mota batzuk ere hauek izan ditzakete:
    • Datu-fitxategia SPS formatuan (xxxx.sav). 2018tik aurrera datuak prestatu diren ikerketetarako eskuragarri (edozein datatako ikerketak barne).
    • Datu-fitxategia CSV formatuan, etiketekin eta etiketarik gabe (xxxx_etiq.csv, xxxx_num.csv). 2023tik aurrera datuak prestatu diren ikerketetarako eskuragarri (edozein datatako ikerketak barne).
    • SASekin lan egiteko mikrodatuen fitxategiak irakurtzeko sintaxi programa (Sasxxxx). ASCII formatuan. 2009ko urtarriletik 2013ko azarora egindako ikerketetarako bakarrik eskuragarri (ikus 'SAS Sintaxi Fitxategiaren Formatua' atala).

Ikerketak mota bereko hainbat dokumentu dituenean (adibidez, galdetegi bat baino gehiago, fitxa bat baino gehiago, etab.), hauek normalean fitxategi konprimitu batean sartzen dira. Mikrodatuak, byte-tan duten tamainaren arabera, ere konprimitu daitezke.

 

Datu fitxategiaren formatua - ASCII

CIS datu-fitxategiak ASCII formatuan (testu formatua) ematen dira eta edozein programa estatistikorekin prozesatu daitezke, hala nola SPSS, SAS, etab.

Mikrodatuen fitxategi bat zenbakien matrize gisa agertzen da, non errenkadak edo erregistroak elkarrizketatuei dagozkien eta zutabeak aldagai bakoitzari emandako erantzunei. Aldagai bakoitzari esleitutako zutabeak kode-liburuan edo galdetegian aurki daitezke, paperean gauzatu bada (PAPI), non erantzun-kategorien eskuinaldean parentesi arteko zenbaki batekin adierazten diren.

Aurretik, matrizearen zutabe kopurua 80ra mugatuta zegoen, beraz, behar adina errenkada erabiltzen ziren elkarrizketatu bakoitzaren informazioa osatzeko. 80 zutabeko errenkada bakoitza ERREGISTRO TXARTEL bati dagokio. Txartel batetik bestera aldaketa galdetegian adierazten da. 2083 zenbakiko ikerketatik (1994ko otsaila) aurrera, CIS galdetegiak ez daude txartelen arabera egituratuta, eta elkarrizketa bakoitzeko informazioa lerro bakarrean erregistratzen da. Bi formatuak (ERREGISTROEKIN edo gabe) batera daude CISek eskaintzen dituen mikrodatuen fitxategietan.

Mikrodatuak anonimizatuta daude elkarrizketatuen banakako identifikazioa saihesteko. Prozesu honetan eragina duten aldagaiak ikerketa espezifikoaren araberakoak dira, baina, oro har, hauek dira: elkarrizketatzailea, sekzioa, barrutia eta 100.000 biztanle edo gutxiago dituzten udalerriak (probintziako edo autonomia erkidegoko hiriburuak izan ezik).

Pisu aldagaiak (WEIGHT) dituzten datuek koma bat (,) izango dute hamartar bereizle gisa. Hori kontuan hartzen da eskualde-ezarpen desberdinak dituzten ordenagailuetan lan egitean. Gainera, ikerketa bakar batek pisu aldagai bat baino gehiago izan ditzake.

Fitxategi formatu hau erabiltzeko, irakurri eranskinean dauden argibideak.

 

Datu fitxategiaren formatua - SAV

.sav fitxategi luzapena IBM SPSS analisi estatistikorako programaren datu-fitxategia da. Datuak dagoeneko prozesatu dira eta aplikaziotik zuzenean lan egiteko prest daude.

Pisu aldagaiak (WEIGHT) dituzten datuek koma bat (,) izango dute hamartar bereizle gisa. Hori kontuan hartzen da eskualde-ezarpen desberdinak dituzten ordenagailuetan lan egitean. Gainera, ikerketa bakar batek pisu aldagai bat baino gehiago izan ditzake.

Ikerketa baten datuak orekatu behar badira, lagin nagusiaren pisu-koefizienteak dituen aldagaiaren arabera haztatuta emango dira, normalean WEIGHT deitzen dena.

 

Datu fitxategiaren formatua - CSV

CSV-k "Comma Separated Values" esan nahi du. Formatu irekia da.

Testu-fitxategi hauek taulen itxura dute, non errenkadak elkarrizketatutako pertsonei dagozkien eta zutabeak aldagaiei.

Fitxategi hauek irakurtzeko modurik ohikoena Excel programa erabiltzea da.

2 bertsiotan eskaintzen dira:

  • aldagai-izen etiketekin eta erantzun-kategoriekin ( xxxx_etiq.csv )
  • etiketarik gabekoa, hau da, zenbakizkoa ( xxxx_num.csv )

Pisu aldagaiak (WEIGHT) dituzten datuek koma bat (,) izango dute hamartar bereizle gisa. Hori kontuan hartzen da eskualde-ezarpen desberdinak dituzten ordenagailuetan lan egitean. Gainera, ikerketa bakar batek pisu aldagai bat baino gehiago izan ditzake.

 

Sintaxi Fitxategiaren Formatua - SPSS

Sintaxi fitxategia ASCII formatuan aurkezten da, baina SPSS prozesatzeko programa estatistikoarekin lan egiteko diseinatuta dago.

Gutxienez, mikrodatuak behar bezala irakurtzeko beharrezkoak diren gutxieneko komandoak ditu: aldagaien definizioa (DATUEN ZERRENDA) eta pisua (PISUA) laginaren diseinuak eskatzen duenean.

Baliteke beste SPSS komando batzuk ez sartzea, hala nola aldagaien etiketak (VARIABLE LABELS) eta erantzun kategoriak (VALUE LABELS), eta RECODE, MISSING VALUES, FREQUENCIES, etab. bezalako komandoak. Batzuetan, aldagaien etiketak (VARIABLE LABELS) aldagai anitzeko osagaietarako (aldagai anitzekoak, erantzun anitzekoak eta dikotomiko anitzekoak) bakarrik ager daitezke. Azterketa berriagoek edo duela gutxi prozesatuek sintaxi osoa dute.

Ponderazio- koefizienteak normalean datu-orrian zehazten dira, nahiz eta batzuetan mikrodatuen fitxategian bakarrik sartzen diren. Ikerketa batek ponderazio-aldagai bat baino gehiago behar baditu (adibidez, PESO eta PESOCCAA), nagusia edo lagin orokorrari eragiten diona bakarrik uzten da aktibo.

1992 eta 1997 artean egindako inkestetarako, sintaxi programa SPSSren bertsio zaharragoetan idatzita egon daiteke, zehazki UNIXen, sintaxia bertsio berriagoekin alderatuta modu apur bat desberdinean kudeatzen baitu. Kasu hauetan, DATA LIST-aren gaineko adierazpenak ezabatu egin behar dira, edo behintzat ez dira exekutatu, eta komando-amaierak gehitu behar dira adierazpenak bereizteko, puntu bat (.) edo lerro huts bat izan daitezkeenak.

Fitxategi formatu hau erabiltzeko, irakurri eranskinean dauden argibideak.

 

Sintaxi Fitxategiaren Formatua - SAS

Sintaxi fitxategia ASCII formatuan aurkezten da, baina SAS prozesatzeko programa estatistikoarekin lan egiteko diseinatuta dago.

Gutxienez, mikrodatuen irakurketa zuzena egiteko beharrezkoak diren adierazpenak ditu. Programan agertzen diren beste adierazpen batzuk aldagaiak eta erantzun kategoriak etiketatzen dituztenak dira.

Formulario hau ez dago jada eskuragarri eta 2009ko urtarriletik 2013ko azarora bitartean egindako ikerketa batzuetarako bakarrik dago eskuragarri.