Formatos más habituales en datos abiertos
El portal de datos abiertos del Ayuntamiento de Madrid publica los datos en distintos formatos. Preferiblemente se utilizan formatos no propietarios, aunque también se genera información en algún formato propietario que sea considerado un estándar de facto por la mayor parte de la ciudadanía:
- CSV: (Comma-separated values). Valores separados por coma. Los ficheros CSV son un tipo de documento en formato abierto sencillo para representar datos en formato de tabla. Las columnas se separan por comas (o punto y coma) y las filas por saltos de línea.
- XLS: (Microsoft Office Excel) Es un formato propietario de Microsoft que muestra la información en celdas organizadas en filas y columnas, y cada celda contiene datos o fórmulas, con referencias relativas o absolutas a otras celdas.
- XML: (Extensible Markup Language). Este formato tiene una importante función en el proceso de intercambio, estructuración y envío de datos en la Red. Describe los datos de tal manera que es posible estructurarlos utilizando para ello etiquetas que no están predefinidas. De esta manera los datos están delimitados, lo que favorece la interoperabilidad de los mismos.
- TXT: Documento de texto plano. Puede utilizar diferentes codificaciones de caracteres.
- RDF: (Resource Description Framework) RDF no es un formato concreto sino una infraestructura para la descripción de los recursos de la red mediante expresiones de la forma sujeto-predicado-objeto. El sujeto es el recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso y el objeto es el valor de la propiedad con el que se establece la relación. La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de las tecnologías esenciales para la web semántica. Existen varios formatos de representación: XML, para procesamiento automático; N3, para representación en texto plano de forma más legible para humanos; Turtle, como simplificación del anterior.
- RSS: (Really Simple Syndication) Es un formato XML para la distribución de contenidos de páginas web. Facilita la publicación de información actualizada a los usuarios suscritos a la fuente RSS sin necesidad de usar un navegador, utilizando un software especializado en este formato.
- SHP: (Shapefile) Es un formato propietario estándar de datos espaciales, desarrollado por la compañía ESRI, que almacena tanto la geometría como la información alfanumérica. Este formato no está preparado para almacenar información topológica. Actualmente se ha convertido en formato estándar de facto para el intercambio de información geográfica entre Sistemas de Información Geográfica por la importancia que los productos ESRI tienen en el mercado SIG y por estar muy bien documentado.
- KML: (Keyhole Markup Language) Es un lenguaje de marcado basado en XML para representar datos geográficos en tres dimensiones.
- DCAT: El Dataset Catalog es un formato RDF que describe de manera estándar los catálogos de datos para que sean interoperables.
- WMS y WFS: Son servicios definidos por el OGC para, de forma dinámica y partir de información geográfica, producir mapas de datos referenciados espacialmente.
- GPX: o GPS (eXchange Format) (Formato de Intercambio GPS) es un esquema XML pensado para representar información para navegadores. Se puede usar para describir puntos (waypoints), recorridos (tracks), y rutas (routes).
- GeoRSS: es un conjunto de estándares para representar información geográfica mediante el uso de capas y está construido dentro de la familia de estándares RSS. El contenido consiste en puntos de interés georreferenciados y otras anotaciones, en general las fuentes se diseñan para generar mapas.
- KMZ: formato de omprensión de ficheros KML.
- GEO: es un microformato utilizado para el marcado de coordenadas geográficas en HTML. El uso de Geo permite a las herramientas que utilicen analizadores sintácticos (por ejemplo otros sitios web, o la extensión Operator de Firefox), extraer las ubicaciones y mostrarlas usando algún otro sitio web o herramienta de mapeo, o cargarlas en un dispositivo GPS, indexarlas, acumularlas, o convertirlas en un formato alternativo.
- MDB: Extensión de archivo utilizado en ciertas versiones de bases de datos de Microsoft Access.
-
ZIP: es un formato de compresión sin pérdida, muy utilizado para la compresión de documentos, imágenes o programas.
-
JSON, acrónimo de JavaScript Object Notation, es un formato de texto ligero para el intercambio de datos. JSON es un subconjunto de la notación literal de objetos de JavaScript aunque hoy, debido a su amplia adopción como alternativa a XML, se considera un formato de lenguaje independiente.
Fuente: Wikipedia y otros