Preguntas frecuentes sobre Open Data
¿Qué es open data?
Son datos públicos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona y para cualquier fin.
¿Qué son los datos públicos?
Se define como dato público aquel que se ha registrado, recopilado o generado por cualquier medio por la Administración Pública (o por terceros por encargo de la Administración Pública).
Quedan excluidos:
- los que estén sujetos a restricciones de privacidad, propiedad, seguridad,
- aquellos datos cuya publicación podría infringir el Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo, de 27 de abril de 2016, Reglamento General de Protección de Datos o RGPD de protección de datos de carácter personal,
- los datos que tengan regulada su publicación mediante un procedimiento administrativo.
¿Qué son los datasets o conjunto de datos?
Son una serie de datos vinculados entre sí y agrupados dentro de un mismo sistema de información. Los dataset se publican en catálogos de datos:
- para facilitar la búsqueda,
- para su potencial reutilización.
El dataset, al que se accede mediante una URL, está constituido por los recursos (ficheros de datos) y los metadatos.
¿Qué son los metadatos?
Son datos que describen otros datos, es decir, describen el contenido de los archivos o la información de estos. Los metadatos "son toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso, dato u objeto con el fin de facilitar su recuperación, autentificación, evaluación, preservación y / o interoperabilidad".
¿Qué se puede hacer con estos datos?
Las principales formas de uso de los datos abiertos tienen que ver con su reaprovechamiento:
- mediante aplicaciones,
- para elaborar diferentes formas de visualización,
- para su análisis con el objetivo de ayudar en la toma de decisiones.
Las posibilidades son tantas como ideas tenga la ciudadanía.
¿Por qué es importante el open data?
La información es la materia prima de la sociedad actual; los datos son especialmente útiles, por lo tanto, es importante que esta información se abra a toda la sociedad para que pueda ser reutilizada.
Las administraciones públicas disponen de mucha información necesaria para llevar a cabo los servicios públicos. Pero esta información puede tener mucha más utilidad aún. Por este motivo, ponerla en manos de la ciudadanía permite que ésta pueda reutilizarla para otros fines y aumente así el beneficio de esta información.
¿Qué normativa existe relacionada con Open Data?
La Directiva Europea 2003/98/CE, de 17 de noviembre de 2003, relativa a la reutilización de la información del sector público, estableció un conjunto de normas para el tratamiento de la información pública reutilizable. Esta fue enmendada como Directiva 2013/37/UE, el 26 de junio de 2013, y transpuesta a nivel estatal como Ley 18/2015, de 9 de julio, modificando la anterior Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. La Ley 18/2015 tiene por objeto la regulación básica del régimen jurídico aplicable a la reutilización de los documentos elaborados o custodiados por las Administraciones y organismos del sector público.
Posteriormente, la Directiva (UE) 2019/1024 del Parlamento Europeo y del Consejo, de 20 de junio de 2019, relativa a los datos abiertos y la reutilización de la información del sector público DEROGA con efectos desde el 17 de julio de 2021 la Directiva 2003/98, de 17 de noviembre (Ref. DOUE-L-2003-82244). La Directiva (UE) 2019/1024 se traspone al ordenamiento estatal por el Real Decreto-ley 24/2021, de 2 de noviembre que modifica la Ley 37/2007.
Por otro lado, y relacionado con la apertura de datos públicos, existe normativa adicional, como es la Ley estatal 19/2013, de 9 de diciembre, de transparencia, acceso a la información pública y buen gobierno y la Norma Foral 1/2017, de 8 febrero, de transparencia, participación ciudadana y buen gobierno del sector público del Territorio Histórico de Álava. Estas normativas tienen por objeto fomentar la participación ciudadana, obligando a las entidades públicas a dar cuenta a la ciudadanía, de acuerdo con el principio de responsabilidad, de su actividad y de la gestión de los recursos públicos.
¿Cuáles son los principales formatos de datos publicados en el portal?
Los principales formatos de los recursos publicados en el portal Open Data de Araba Irekia son los siguientes:
- CSV: Los archivos CSV (Comma-Separated Values) son un tipo de documento abierto que representa tablas con columnas separadas por comas y filas por saltos de línea.
- XLSX: El formato XLSX hace referencia a los archivos que utiliza el programa de cálculo Microsoft Excel. Los datos están presentados en líneas y columnas.
- XML: Los archivos XML (eXtensible Markup Language) se basan en un lenguaje desarrollado por el World Wide Web Consortium (W3C) que permite definir la gramática de lenguajes específicos para estructurar grandes documentos.
- JSON: Acrónimo de JavaScript Object Notation, es un formato de texto ligero para el intercambio de datos. Es un subconjunto de la notación literal de objetos de JavaScript aún hoy, por su amplia adopción como alternativa a XML, se considera un formato de lenguaje independiente.
- KMZ: (Keyhole Markup language Zipped) es una versión comprimida en Zip de un archivo KML (Keyhole Markup Language), el cual se encarga de almacenar las ubicaciones de mapas que se pueden ver en varias aplicaciones de sistemas de información geográfica (GIS), sobre todo Google Earth. Keyhole, fue la empresa fundadora del software Earth Viewer sobre el que se construyó Google Earth.
- KML: Los archivos KML (Keyhole Markup Language) especifican un conjunto de características (marcas de lugar, imágenes, polígonos, modelos 3D, descripciones textuales, etc.) para la visualización en Google Earth, Maps y Mobile, o cualquier otro software geoespacial de la aplicación de la codificación KML. Cada sitio tiene siempre una longitud y una latitud.
- DAT: Estos archivos DAT pueden ser codificados en formato de texto plano, mientras que algunos archivos DAT se implementan con especificaciones de codificación binaria.
¿Qué son las 5 estrellas de Tim Berners-Lee?
La clasificación basada en estrellas y desarrollada por Tim Berners-Lee permite cuantificar la calidad tecnológica del open data, en función del formato utilizado para representar los datos.
Es un esquema incremental donde cada nivel incluye el anterior.
★ Una estrella
- Datos o documentos disponibles en la web en cualquier formato.
- Bajo una licencia abierta no restrictiva.
- Formato no estructurado.
- El conjunto de datos o documento se puede visualizar en la web, pero no se puede procesar automáticamente.
Ejemplos: una imagen en formato JPG o PNG, o un documento escaneado en formato PDF.
★★ Dos estrellas
- Datos o documentos estructurados.
- Procesables automáticamente.
- Formato propietario (no abierto).
Ejemplo: una hoja de cálculo en formato Microsoft Excel.
★★★ Tres estrellas
- Formato estructurado y abierto (no propietario).
Ejemplo: la hoja de cálculo en formato CSV (valores separados por comas).
★★★★ Cuatro estrellas
- Los datos pueden ser referenciados con direcciones web persistentes o identificadores de recursos uniformes (URI).
- Se utilizan formatos estándares y abiertos del W3C (World Wide Web Consortium) para describir semánticamente la información.
Ejemplo: representación en el modelo RDF (infraestructura de descripción de recursos) de los edificios de un organismo público, con sus datos de contacto y ubicación, datos atómicos en los que se puede acceder mediante direcciones web (URI). También se podrían considerar ciertas APIs (Application Programming Interfaces)
★★★★★ Cinco estrellas
- Datos enlazados y descritos semánticamente con otros conjuntos de datos externos para ofrecer contexto a la información.
- Se establecen relaciones semánticas entre la información enlazada.
Ejemplo: en el caso anterior, las descripciones de la ubicación de los edificios públicos podrían estar enlazadas a la DBpedia (http://dbpedia.org). Con estos enlaces se podría incluir una descripción en detalle de las localidades, regiones, o países y así tener acceso de forma directa a información socioeconómica o toponímica de estos lugares.
La excelencia técnica (cinco estrellas) se consigue cuando los datos son enlazados con otros recursos en la web mediante mecanismos semánticos. Así, ofrecen una interoperabilidad plena entre diferentes sistemas, y permiten una posterior reutilización mucho más eficiente.
¿Qué licencias tienen asociadas los conjuntos de datos?
Cada conjunto de datos tiene asociado sus propios términos de uso.
Por defecto, los recursos publicados en Open Data de Araba Irekia están sujetos a una licencia CC BY 4.0 Creative Commons Attribution 4.0 International lo que significa que permite difundir, reutilizar o adaptar los datos sin restricción alguna. Pero se exige la referencia a la autoría o fuente de los datos para la reutilización de la información.
¿Cómo se clasifican los datos en el catálogo?
La clasificación de los datasets sigue la normativa estatal. Los temas disponibles son los siguientes:
- Ciencia-Tecnología. Incluye: Innovación, Investigación, I+D+i, Telecomunicaciones, Internet y Sociedad de la Información.
- Comercio. Incluye: Consumo
- Cultura y Ocio.
- Demografía. Incluye: Inmigración y Emigración, Familia, Mujeres, Infancia, Mayores y Padrón.
- Deporte.
- Economía. Incluye: Deuda, Moneda, Banca, Finanzas y Presupuestos.
- Educación. Incluye: Formación.
- Empleo.
- Energia.
- Hacienda. Incluye: Impuestos.
- Industria.
- Legislación. Incluye: Registros.
- Medio ambiente. Incluye: Meteorología, Geografía y Conservación fauna y flora.
- Medio rural. Incluye: Agricultura, Ganadería, Caza y Pesca y Silvicultura.
- Salud.
- Sector público. Incluye: Presupuestos, Organigrama institucional, Normativa interna y Función pública.
- Seguridad. Incluye: Protección civil y Defensa.
- Sociedad y bienestar. Incluye: Participación ciudadana, Marginación, Envejecimiento Activo, Autonomía personal y Dependencia, Invalidez, Jubilación, Seguros y Pensiones y Prestaciones y Subvenciones.
- Transporte. Incluye: Comunicaciones y Tráfico.
- Turismo. Incluye: Alojamientos, Hostelería y Gastronomía.
- Urbanismo e infraestructuras. Incluye: Saneamiento público y Construcción (infraestructuras y equipamientos públicos).
- Vivienda.
¿Cuántos conjuntos de datos hay disponibles?
Para conocer los conjuntos de datos publicados se debe consultar el catálogo.
¿Cómo se pueden buscar conjuntos de datos?
Para buscar un conjunto de datos concreto hay que dirigirse al catálogo. La búsqueda se puede realizar mediante el buscador habilitado o haciendo uso de los filtros en la parte izquierda de la pantalla.
Actualización de los recursos de un dataset
La fecha de la última actualización se indica en la información ofrecida dentro del dataset o conjunto de datos.
En la sección “Estadística” del dataset, puede consultar la cobertura temporal de la información.
Si crees que algún conjunto de datos no está debidamente actualizado, nos lo puedes comunicar a través del apartado “Colabora”.
¿Cómo se pueden solicitar nuevos datos?
La solicitud se puede realizar mediante la opción “Colabora”
¿Habrá más datos disponibles en un futuro?
En la sección Open Data de Araba Irekia tratamos de publicar nuevos datos continuamente.
¿Cómo se realiza la atribución al origen de los datos?
La atribución al origen de los datos se hace citando su origen de manera explícita en el portal Open Data de Araba Irekia, de la siguiente forma:
- En el caso de permitir código HTML: este producto o servicio usa datos procedentes del portal Open Data Araba Irekia.
- En el caso de sólo permitir texto: este producto o servicio usa datos procedentes del portal Open Data de Araba Irekia.