Datu-fitxategiei buruzko argibideak
CIS Datu-baseak etengabe ari da lanean ikerketa-dokumentazioa prestatzen zabaltzeko.
Ikerketa berriak erakundearen webgunean daude eskuragarri (www.cis.es), dokumentazio osoarekin , datuak kodetzeko, garbitzeko, balioztatzeko eta anonimizatzeko zeregin tekniko garrantzitsuak, informazioa katalogatzeaz gain, amaitu ondoren.
Erakundearen artxiboan 2000. urtea baino lehen dauden ikerketa zaharragoen kasuan, haien datu-fitxategiak berrikusi eta azterketaren urtearen arabera edo gai-bildumaren arabera ordena kronologiko beherakorrean prestatzen dira, haien dokumentazioa webean ere osorik eskuragarri egon dadin.
CISek etengabe lan egiten du bere datu-fitxategien formatuak modernizatzeko eta zabaltzeko, neutraltasun teknologikoaren printzipioa sustatuz eta ikerketa-komunitatearentzat eta haiekin lan egin nahi duten besteentzat errazago kudeatu eta ulertu ahal izateko.
Datu-fitxategietarako sarbidea
CIS datu-fitxategiak deskargatzeko, lehenik formulario bat bete behar duzu. Bildutako informazioa Erakundeak prozesatzeko estatistikarako edo, hala badagokio, eskatutako ikerketan datuetan egindako aldaketak erabiltzaileari jakinarazteko soilik da.
Fitxategiak banaka bakarrik deskargatu daitezke, ikasketaz ikasketa; deskarga masiboak ezinezkoak dira.
Datu fitxategiaren formatua
CIS inkesten mikrodatuen fitxategiak (datu matrizeak), haien dokumentazio teknikoarekin batera, formatu konprimituan deskargatzen dira ( MDxxxx.zip ), beraz, haiekin lan egin aurretik atera egin behar dira.
Fitxategi honek ikerketaren ustiapenerako beharrezkoak diren fitxategi hauek ditu:
- Dokumentazioa:
- Galdetegia ( galdetegiakxxxx ). PDF formatuan.
- Fitxa teknikoa ( Ftxxxx ). PDF formatuan.
- Kode-liburua ( codexxxx ). PDF formatuan.
- Txartelak ( cardsxxxx ). PDF formatuan (aurrez aurreko elkarrizketa bidez egindako inkestetarako soilik).
- Mikrodatuen fitxategi anonimizatua ( DAxxxx ) ASCII formatuan. (Irakurri 'Datu fitxategiaren formatua - ASCII' eta ' Eranskina ' atalak).
- SPSSrekin lan egiteko mikrodatuen fitxategiak irakurtzeko sintaxi programa ( ESxxxx ). ASCII formatuan. (Irakurri 'SPSS Sintaxi Fitxategiaren Formatua' eta ' Eranskina ' atalak).
- Beste fitxategi mota batzuk ere hauek izan ditzakete:
- SPSS-tik ateratako mikrodatuen fitxategia SAV formatuan ( xxxx.sav ). 2018tik aurrera datuak prestatu diren ikerketetarako eskuragarri (edozein datatako ikerketak barne).
- Mikrodatuen fitxategia CSV formatuan, etiketekin eta etiketarik gabe ( xxxx_etiq.csv , xxxx_num.csv ). 2023tik aurrera prestatutako datuak dituzten ikerketetarako eskuragarri (edozein datatako ikerketak barne).
- SASekin lan egiteko sintaxi-fitxategiak irakurtzeko programa ( Sasxxxx ). ASCII formatuan. 2009ko urtarriletik 2013ko azarora egindako ikerketa batzuetarako bakarrik eskuragarri. (Ikusi 'SAS Sintaxi Fitxategiaren Formatua' atala).
Ikerketak mota bereko hainbat dokumentu dituenean (adibidez, galdetegi bat baino gehiago, fitxa bat baino gehiago, etab.), hauek normalean fitxategi konprimitu batean sartzen dira. Mikrodatuak, byte-tan duten tamainaren arabera, konprimituta ere aurkez daitezke.
Gai orokor garrantzitsuak
- Mikrodatuak anonimizatuta daude elkarrizketatuen banakako identifikazioa saihesteko. Prozesu honetan eragina duten aldagaiak ikerketa espezifikoaren araberakoak dira, baina oro har hauek dira: elkarrizketatzailea, errolda-sekzioa, barrutia eta 100.000 biztanle edo gutxiagoko udalerriak (probintziako edo autonomia-erkidegoko hiriburuak izan ezik). Informazio gehiago lortzeko, ikusi " Anonimizazio Sistemak " atala.
-
Ikerketa batzuek datuak berriro orekatzea edo laginaren diseinuaren arabera ponderatzea eskatzen dute. Honek, oro har, lagin nagusiari bakarrik eragiten dio, baina batzuetan beste tratamendu-maila batzuei ere bai. Informazio hau datu-orrian islatuko da, nahiz eta ponderazio-koefizienteak mikrodatuen fitxategian bakarrik zehaztu daitezkeen.
GARRANTZITSUA Datuak behar bezala ustiatzeko, fitxa teknikoan adierazitako ponderazio-koefizienteak aplikatu behar dira.
Ponderazio aldagaiek normalean 'WEIGHT' letrekin hasten den izen estandarizatua izaten dute (PESO, PESOCCAA, PESOPROV, etab.), eta normalean mikrodatuen fitxategiaren amaieran kokatzen dira.
Ponderazio-koefizienteak komaz (,) bereizten dira. Garrantzitsua da hau gaztelaniaz bestelako eskualde-ezarpenak dituzten ordenagailuetan lan egitean.
-
Mikrodatuen fitxategi bat zenbakien matrize gisa agertzen da, non errenkadak edo erregistroak elkarrizketatuei dagozkien eta zutabeak aldagai bakoitzari emandako erantzunei. Aldagai bakoitzari esleitutako zutabeak kode-liburuan aurki daitezke, edo galdetegian, paperean gauzatu bada (PAPI), non erantzun-kategorien eskuinaldean parentesi arteko zenbaki batekin adierazten diren.
Lehen, datu-matrizeen zutabe kopurua 80ra mugatzen zen, beraz, behar adina errenkada erabiltzen ziren elkarrizketatu bakoitzaren informazioa osatzeko. 80 zutabeko errenkada bakoitzari ERREGISTRO TXARTEL bat dagokio. Txartel batetik bestera igarotzea galdetegian adierazten da (T1, T2, etab.).
2083 zenbakiko ikerketatik (1994ko otsaila) aurrera, CIS galdetegiak ez zeuden txartelen bidez egituratuta, eta elkarrizketa bakoitzeko informazioa lerro bakarrean erregistratu zen.
Bi formatuak (ERREGISTROEKIN/ERREGISTROIK GABE) batera daude CISek eskaintzen dituen mikrodatuen fitxategietan.
Datu fitxategiaren formatua - ASCII
CIS datu-fitxategiak ASCII formatuan (testu irekiko formatua) ematen dira eta edozein software estatistikorekin erabil daitezke: SPSS, SAS, R, etab.
GARRANTZITSUA Ikerketa-datuek ponderazioa behar dutenean, kontuan izan fitxategi-formatu honetan datuak ez direla ponderatua ematen , beraz, ustiatzeko koefizienteak aplikatu behar direla.
Fitxategi formatu hau erabiltzeko, irakurri eranskinean dauden argibideak.
Datu fitxategiaren formatua - SAV
.sav fitxategi luzapena IBM SPSS analisi estatistikorako programaren datu-fitxategia da. Datuak dagoeneko prozesatu dira eta aplikaziotik zuzenean lan egiteko prest daude.
Ikerketa zaharretan, aldagaien etiketak eta erantzun-kategorien etiketak ez dira sartuko. Batzuetan, aldagaien etiketak ager daitezke, baina osagai anitzeko aldagaietarako bakarrik (MV anitzekoa, MR anitzekoa eta MD multidikotomikoa). Ikerketa berriagoek, edo duela gutxi prozesatu direnek, etiketa osoak dituzte.
GARRANTZITSUA: Ikerketa bateko datuek oreka behar badute, haztatuta emango dira. Haztatze-aldagai bat baino gehiago badago, aktibatuta agertuko dena lagin nagusiari eragiten diona izango da, normalean WEIGHT gisa ezagutzen dena.
Datu fitxategiaren formatua - CSV
CSV-k "Comma Separated Values" esan nahi du. Formatu irekia da.
Fitxategi hauek taulen itxura dute, non errenkadak elkarrizketatutako pertsonei dagozkien eta zutabeak aldagaiei.
Fitxategi hauek irakurtzeko modurik ohikoena Excel programa erabiltzea da.
2 bertsiotan eskaintzen dira:
- aldagai-izen etiketekin eta erantzun-kategoriekin ( xxxx_etiq.csv )
- etiketarik gabekoa, hau da, zenbakizkoa ( xxxx_num.csv )
GARRANTZITSUA Ikerketa-datuek ponderazioa behar dutenean, kontuan izan fitxategi-formatu honetan datuak ez direla ponderatua ematen , beraz, ustiatzeko koefizienteak aplikatu behar direla.
Sintaxi Fitxategiaren Formatua - SPSS
Sintaxi fitxategia ASCII formatuan aurkezten da, baina SPSS prozesatzeko programa estatistikoarekin lan egiteko diseinatuta dago.
Gutxienez, mikrodatuak behar bezala irakurtzeko beharrezkoak diren gutxieneko komandoak ditu: aldagaien definizioa (DATUEN ZERRENDA) eta pisua (PISUA) laginaren diseinuak eskatzen duenean.
Baliteke beste SPSS komando batzuk ez sartzea, hala nola aldagaien etiketak (VARIABLE LABELS) eta erantzun kategoriak (VALUE LABELS), eta RECODE, MISSING VALUES, FREQUENCIES, etab. bezalako komandoak. Batzuetan, aldagaien etiketak (VARIABLE LABELS) ager daitezke, baina osagai anitzeko aldagaietarako bakarrik (MV anitzekoa, MR anitzeko erantzuna eta MD multidikotomikoa). Ikerketa berriagoek, edo duela gutxi prozesatu direnek, sintaxi osoa dute.
GARRANTZITSUA Ikerketa batek pisu -aldagai bat baino gehiago behar baditu (adibidez, PESO eta PESOCCAA), nagusia edo lagin globalena eragiten duena bakarrik uzten da aktibatuta (WEIGHT BY PESO), besteak ez dira sintaxian ager daitezke edo komentatuta egon daitezke (/* eta */-k definitutako testua).
1992 eta 1997 artean egindako inkestetarako, sintaxi programa SPSSren bertsio zaharragoetan idatzita egon daiteke, zehazki UNIXen, sintaxia bertsio berriagoekin alderatuta modu apur bat desberdinean kudeatzen baitu. Kasu hauetan, DATA LIST-aren gaineko adierazpenak ezabatu egin behar dira, edo behintzat ez dira exekutatu, eta komando-amaierak gehitu behar dira adierazpenak bereizteko, puntu bat (.) edo lerro huts bat izan daitezkeenak.
Fitxategi formatu hau erabiltzeko, irakurri eranskinean dauden argibideak.
Sintaxi Fitxategiaren Formatua - SAS
Sintaxi fitxategia ASCII formatuan aurkezten da, baina SAS prozesatzeko programa estatistikoarekin lan egiteko diseinatuta dago.
Gutxienez, mikrodatuen irakurketa zuzena egiteko beharrezkoak diren adierazpenak ditu. Programan agertzen diren beste adierazpen batzuk aldagaiak eta erantzun kategoriak etiketatzen dituztenak dira.
Formulario hau ez dago jada eskuragarri eta 2009ko urtarriletik 2013ko azarora bitartean egindako ikerketa batzuetarako bakarrik dago eskuragarri.