Portal de la Junta de Andalucía
Buscador general

p. ej. ofertas de empleo, ayudas, escolarización...

Datos abiertos > Ayuda > Documentación técnica > En qué formatos se publican los datos

En qué formatos se publican los datos

El objetivo final del proyecto es conseguir que se publique la mayor cantidad de información posible utilizando formatos estructurados y preferiblemente no propietarios que sean procesables de forma automática. El World Wide Web Consortium (W3C), la comunidad internacional que desarrolla estándares para la evolución de la Web, recomienda que los datos que se liberen sean útiles y estén en formatos reutilizables.

Cuanto mejor estructurados y enriquecidos estén los datos, más fácil será reutilizarlos y construir aplicaciones que puedan tratarlos automáticamente. El propio W3C define una escala de clasificación orientativa para los distintos niveles de desarrollo en los que nos podemos encontrar los datos.

Algunos de los formatos comunes que se pueden encontrar son:

  • CSV (Comma-separated values): Es un formato simple para el almacenamiento de datos tabulares en texto plano que se utiliza frecuentemente para el intercambio de información entre distintas hojas de cálculo que utilizan otros formatos propietarios.
  • RSS (Really Simple Sindication): Es un vocabulario que permite la catalogación de información de manera que sea posible encontrar información precisa adaptada a las preferencias de los usuarios. Los archivos RSS contienen metadatos sobre fuentes de información especificadas por los usuarios cuya función principal es avisar a los usuarios de que los recursos que ellos han seleccionado para formar parte de esa RSS han sido actualizados sin necesidad de comprobar directamente la fuente, es decir, notifican de forma automática cualquier cambio que se realice en esos recursos.
  • XML (eXtensible Markup Language): Es un lenguaje con una importante función en el proceso de intercambio, estructuración y envío de datos en la Web. Describe los datos de tal manera que es posible estructurarlos utilizando para ello etiquetas, como lo hace HTML, pero que en este caso no están predefinidas, sino que podemos definir nuevos vocabularios para cubrir nuestras necesidades como por ejemplo KML (Keyhole Markup Language) para la creación de modelos y el almacenamiento de funciones geográficas que utilizarán principalmente en aplicaciones de geoposicionamiento y mapas.
  • JSON (JavaScript Object Notation): Es un formato para el intercambio de datos entre aplicaciones basado en una simplificación en la notación de objetos de JavaScript pero independiente de lenguaje. Su simplicidad lo ha hecho muy popular como alternativa al XML para la transmisión de datos estructurados entre servidores y aplicaciones web a través de la red.
  • RDF (Resource Description Framework): Es un modelo universal para representar datos en la Web, que permite intercambiar y enlazar información y recursos a través de diferentes aplicaciones sin que esos datos pierdan significado, lo que facilita la reutilización y enriquecimiento de los recursos en la Web. RDF sin embargo no es un formato en sí mismo, sino un modelo abstracto que se representa a través de diversas serializaciones, siendo la más frecuente la que utiliza la notación XML/RDF.

Dado que la prioridad del proyecto a corto plazo es la publicación del mayor volumen de datos, en algunos casos es posible que se publique los datos en crudo (raw data en inglés) utilizando directamente los formatos y medios ya disponibles, incluyendo algunos formatos no estructurados y/o propietarios.

Documentación técnica