Open Datari buruzko ohiko galderak
Zer da Open Data
Edozein pertsonak libreki eta edozein helburutarako erabili, berrerabili eta birbanatu ditzakeen datu publikoak dira.
Zer dira datu publikoak?
Datu publikotzat hartzen da Administrazio publikoak (edo hirugarrenek, administrazio publikoari hala eskatuta) edozein baliabide erabilita erregistratu, bildu edo sortu duena.
Salbuetsita geratzen dira:
- pribatutasuna, jabetza eta segurtasun murrizketak dituztenak,
- - Europako Parlamentuaren eta Kontseiluaren 2016ko apirilaren 27ko 2016/679 (EB) Erregelamendua, Datuak Babesteko Erregelamendu Orokorra edo Datu Pertsonalak Babesteko DBEO urra dezaketen datuak,
- beren argitalpena administrazio prozedura baten bidez araututa duten datuak.
Zer dira datasetak edo datu multzoak?
Elkarri lotutako datuak dira, eta informazio sistema beraren barruan bilduta daude. Datasetak datu katalogoetan argitaratzen dira:
- bilketa errazteko,
- berrerabil ahal izateko.
Dataseta osatzen dute: baliabideek (hau da, datu fitxategiek) eta metadatuek; horretaz gain, datasetera url baten bidez sartzen da.
Zer dira metadatuak?
Beste datu batzuk deskribatzen dituzten datuak dira; hau da, fitxategien edukia edo horien informazioa deskribatzen dute. Metadatuak "baliabide, datu edo objektu baten testuinguruari, kalitateari, baldintzei edo ezaugarriei buruzko informazio deskriptiboa da, haren berreskurapena, autentifikazioa, ebaluazioa, babesa eta/edo elkarreragingarritasuna errazteko".
Zer egin daiteke datu horiekin?
Datu irekiak erabiltzeko modu nagusiak berrerabilpenarekin lotuta daude:
- aplikazioen bidez,
- bistaratzeko hainbat modu lantzeko,
- aztertzeko, hau da, erabakiak hartzerako orduan laguntzeko.
Aukerak herritarrek dituzten ideiak adina dira.
Zergatik da garrantzitsua Open Data?
Informazioa gaur egungo gizartearen lehengaia da; datuak bereziki erabilgarriak dira; beraz, garrantzitsua da informazio hori gizarte osoari zabaltzea, berrerabili ahal izateko.
Administrazio publikoek informazio asko maneiatzen dute zerbitzu publikoak behar bezala gauzatzeko. Baina informazio hori askoz ere erabilgarriagoa izan daiteke. Hori dela eta, herritarren esku jartzeak beste helburu batzuetarako berrerabili ahal izatea eta informazio horren onura handitzea ahalbidetzen du.
Zein araudi dago Open Datarekin lotuta?
2003/98/EE Europako Zuzentarauak, 2003ko azaroaren 17koak, sektore publikoko informazioa berrerabiltzeari buruzkoak, arau multzo bat ezarri zuen informazio publiko berrerabilgarria tratatzeko. 2013ko ekainaren 26an zuzendu zen 2013/37/EB Zuzentarau gisa, eta Estatuan uztailaren 9ko 18/2015 Lege gisa sartu zen, azaroaren 16ko 37/2007 Legea aldatuta, Sektore Publikoko informazioa berrerabiltzeari buruzkoa. 18/2015 Legearen xedea da administrazioek eta sektore publikoko organismoek egindako edo zaindutako dokumentuak berrerabiltzean aplikatu beharreko araubide juridikoaren oinarrizko erregulazioa egitea.
Ondoren, Europako Parlamentuaren eta Kontseiluaren 2019/1024 (EB) Zuzentaraua, 2019ko ekainaren 20koa, INDARGABETZEN DU azaroaren 17ko 2003/98 Zuzentaraua, sektore publikoaren datu irekiei eta informazioaren berrerabilpenari buruzkoa, (Erref.: DOUE-L-2003-82244). 2019/1024 (EB) Zuzentaraua Estatuko ordenamendura lekualdatzen du azaroaren 2ko 24/2021 Errege Lege Dekretuak, 37/2007 Legea aldatzen duenak. Egiten dituen aldaketak, besteak beste, honako hauetan oinarritzen dira: datu dinamikoak bitarteko tekniko egokien bidez denbora errealean eskuratzeko prestazioan, balio handiko datu publikoen multzoan (enpresa publikoenak, ikerketa finantzatzen duten erakundeenak eta ikerketa jarduerak egiten dituzten erakundeenak barne); eta, Zuzentarau berriaren eta hari lotutako zenbait tresna juridikoren arteko harremanean, hala nola (EB) 2016/679 Erregelamendua, datu pertsonalen tratamenduari eta datu horien zirkulazio askeari dagokienez pertsona fisikoen babesari buruzkoa.
Bestalde, eta datu publikoak irekitzearekin lotuta, araudi gehigarria dago, hala nola Estatuko 19/2013 Legea, abenduaren 9koa, gardentasunari, informazio publikoa eskuratzeko bideari eta gobernu onari buruzkoa, eta 1/2017 Foru Araua, otsailaren 8koa, Arabako Lurralde Historikoko sektore publikoaren gardentasunari, herritarren parte-hartzeari eta gobernu onari buruzkoa. Araudi horien helburua herritarren parte-hartzea sustatzea da, erakunde publikoak herritarrei erantzukizun printzipioaren, jardueraren eta baliabide publikoen kudeaketaren berri ematera behartuz.
Zeintzuk dira atarian argitaratutako datuen formatu nagusiak?
Hauek dira Araba Irekia atariaren Open Data atalean argitaratutako baliabideen formatu nagusiak:
- CSV: CSV fitxategiak (Comma-Separated Values) dokumentu ireki mota bat dira, komen eta lerroen bidez bereizitako zutabeak dituzten taulak irudikatzen dituena.
- XLSX: XLSX formatuak Microsoft Excel kalkulu-programak erabiltzen dituen fitxategiei egiten die erreferentzia. Datuak lerroetan eta zutabeetan daude aurkeztuta.
- XML: XML fitxategiak (eXtensible Markup Language) World Wide Web Consortium (W3C) delakoak garatutako lengoaia batean oinarritzen dira, eta dokumentu handiak egituratzeko lengoaia espezifikoen gramatika definitzea ahalbidetzen du.
- JSON: JavaScript Object Notation-en akronimoa, datuak trukatzeko testu arineko formatua da. JavaScripten objektuen hitzez hitzeko notazioaren azpimultzo bat da; izan ere, gaur egun oraindik ere, XMLren alternatiba gisa duen onarpen zabalagatik, lengoaia independentearen formatutzat hartzen da.
- KMZ: (Keyhole Markup language Zipped) KML (Keyhole Markup Language) fitxategi baten bertsio konprimatua da, informazio geografikoko sistemen zenbait aplikaziotan (GIS) ikus daitezkeen mapen kokapenak biltegiratzeaz arduratzen dena, batez ere Google Earth. (Keyhole izan zen Earth Viewer softwarearen enpresa sortzailea, eta haren gainean eraiki zen Google Earth).
- KML: : KML fitxategiek (Keyhole Markup Language) ezaugarri multzo bat zehazten dute (leku-markak, irudiak, poligonoak, 3D ereduak, testu-deskribapenak, etab.) Google Earth, Maps eta Mobile edo KML kodifikazioaren aplikazioaren beste edozein software geoespazial ikusteko. Leku bakoitzak longitudea eta latitudea ditu beti.
- DAT: DAT fitxategiak testu lauaren formatuan kodetu daitezke; beste DAT fitxategi batzuk, berriz, kodifikazio bitarreko zehaztapenekin inplementatzen dira.
Zer dira Tim Berners-Leeren 5 izarrak?
Tim Berners-Leek garatutako izarretan oinarritutako sailkapenari esker, open dataren kalitate teknologikoa kuantifikatu daiteke, datuak irudikatzeko erabilitako formatuaren arabera.
Eskema inkrementala da; horregatik, maila bakoitzak aurrekoa barne hartzen du.
★ Izar bat
- Webgunean edozein formatutan eskura daitezkeen datuak edo dokumentuak.
- Lizentzia ireki eta ez-murriztaile baten pean.
- Egituratu gabeko formatua.
- Datu multzoa edo dokumentua webgunean bistaratu daitekeen arren, ezin da automatikoki prozesatu.
Adibideak: irudi bat PNG edo JPG formatuan, edo eskaneatutako dokumentua PDF formatuan.
★★ Bi izar
- Egituratutako datuak edo dokumentuak
- Automatikoki prozesatu daitezkeenak
- Jabedun formatua (ez irekia)
Adibidea: Microsoft Excel formatuko kalkulu orri bat.
★★★ Hiru izar
- Formatu egituratua eta irekia (jaberik gabea).
Adibidea: CSV formatuko kalkulu orria (komaz bereizitako balioak).
★★★★ Lau izar
- Datuak erreferentzia daitezke helbide iraunkorrekin edo baliabide uniformeen identifikatzaileekin (URI).
- W3Cren (World Wide Web Consortium) formatu estandarrak eta irekiak erabiltzen dira informazioa semantikoki deskribatzeko.
Adibidea: erakunde publiko baten eraikinak RDF ereduan irudikatzea (baliabideak deskribatzeko azpiegitura), haien harremanetarako eta kokapenaren datuekin; datu hauek atomikoak dira, eta web helbideen bidez (URI) eskura daitezke. Zenbait API (Application Programming Interface) ere har daitezke kontuan.
★★★★★ Bost izar
- Informazioari testuingurua emateko kanpoko beste datu multzo batzuekin semantikoki lotutako eta deskribatutako datuak.
- Lotura semantikoak ezartzen dira estekatutako informazioaren artean.
Adibidea: aurreko adibidearekin jarraituz, eraikin publikoen kokapenaren deskribapenei DBpediarako estekak gehitu ahal zaizkie. Esteka horien bidez, udalerrien, eskualdeen edo herrialdeen deskribapen zehatza egin daiteke, eta, horrela, zuzenean eskuratu liteke toki horietarako informazio sozioekonomikoa edo toponimikoa.
Bikaintasun teknikoa (hau da, bost izar) lortzen da datuak webeko beste baliabide batzuekin mekanismo semantikoen bidez lotzen direnean. Mekanismo horiek sistema desberdinen arteko elkarreragingarritasun osoa eskaintzen dute, eta, gerora, askoz ere modu eraginkorragoan berrerabiltzea ahalbidetzen dute.
Zer lizentzia dituzte datu multzoek?
Datu multzo bakoitzak bere erabilera terminoak ditu.
Berez, Araba Irekiaren atarian Open Data atalean argitaratutako baliabideek CC BY 4.0 Creative Commons Attribution 4.0 International lizentzia behar dute, eta horrek esan nahi du datuak inolako murrizketarik gabe zabaltzeko, berrerabiltzeko edo egokitzeko aukera ematen duela. Baina datuen egiletza edo iturria ezinbestez aipatu behar da informazioa berrerabiltzeko.
Nola sailkatzen dira datuak katalogoan?
Dataseten sailkapenak Estatuko araudia jarraitzen du. Eskuragarri dauden gaiak honako hauek dira:
- Zientzia-teknologia: Berrikuntza, Ikerkuntza, Telekomunikazioak, Internet eta Informazioaren Gizartea barne.
- Merkataritza: Kontsumoa barne.
- Cultura y Ocio.
- Demografia. Immigrazioa eta Emigrazioa, Familia, Emakumeak, Haurtzaroa, Adineko Pertsonak eta Errolda barne.
- Kirola.
- Ekonomia. Zorra, Moneta, Bankua eta Finantzak eta Aurrekontuak barne.
- Hezkuntza: Prestakuntza barne.
- Enplegua.
- Energia.
- Ogasuna: Zergak barne.
- Industria.
- Legeria: Erregistroak barne.
- Ingurumena: Meteorologia, Geografia eta Fauna eta floraren kontserbazioa barne.
- Landa eremua: Nekazaritza, Abeltzaintza, Ehiza eta Arrantza, eta Basogintza hartzen ditu.
- Osasuna.
- Sektore publikoa. Aurrekontuak, Organigrama instituzionala, Barruko araudia eta Funtzio Publikoa barne.
- Segurtasuna Babes zibila eta Defentsa barne.
- Gizartea eta ongizatea: Herritarren partaidetza, bazterketa, zahartze aktiboa, autonomia pertsonala eta mendekotasuna, baliaezintasuna, erretiroa, pentsioak, prestazioak eta dirulaguntzak barne.
- Garraioa: Komunikazioak eta Trafikoa barne.
- Turismoa. Ostatuak, Ostalaritza eta Gastronomia barne.
- Hirigintza eta azpiegiturak: Saneamendu publikoa, Eraikuntza (azpiegiturak eta ekipamendu publikoak) barne.
- Etxebizitza.
Zenbat datu multzo daude eskuragarri?
Argitaratutako datu multzoak ezagutzeko, katalogoa kontsultatu behar da.
Nola bila daitezke datu multzoak ?
Datu multzo jakin bat bilatzeko, katalogora jo behar da. Bilaketa hori gaitutako bilatzailearen bidez egin daiteke, edo pantailaren ezkerraldean dauden iragazkiak erabilita.
Dataset baten baliabideen eguneraketa
Azken eguneratzearen data dataset edo datu multzoaren barruan emandako informazioan adierazten da.
Dataseteko “Estatistika” atalean, informazioaren denbora estaldura kontsulta dezakezu.
Datu multzoren bat behar bezala eguneratuta ez dagoela uste baduzu, jakinarazi iezaguzu “Lagundu” atalaren bidez.
Etorkizunean datu gehiago egongo dira eskuragarri?
Araba Irekia atariaren Open Data atalean datu berriak etengabe argitaratzen saiatzen gara.
Nola esleitzen da datuen jatorria?
Araba Irekia atariaren Open Data atalean, datuen jatorria modu esplizituan aipatuta esleitzen da, honela:
- HTML kodea baimenduz gero, honela adierazi beharko da: produktu edo zerbitzu honek Araba Irekia atariaren Open Data ataletik datozen datuak erabiltzen ditu.
- Testua bakarrik baimenduz gero: produktu edo zerbitzu honek Araba Irekia atariaren Open Data ataletik datozen datuak erabiltzen ditu.