You are on page 1of 26

d

Introducción a los Metadatos en Ecología
Antonio Jesús Pérez Luque ajperez@ugr.es

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática Universidad de Granada Nov. 2010

Introducción a los Metadatos en Ecología.

1 Concepto e Importancia de los Metadatos.
Cuando hablamos de metadatos nos estamos refiriendo a la “información sobre los datos”. Más formalmente, se trata de la información de nivel superior que describe el contenido, calidad, estructura y accesibilidad de un conjunto específico de datos (Michener et al. 1997). De una forma sencilla, si tenemos un conjunto de datos, los metadatos son la información que nos describe quien, que, cuando, donde y porque de ese conjunto de datos. Es decir, nos informan sobre el contexto en el que se tomaron los datos, los protocolos utilizados, la estructura y el formato que presentan; proporcionando de esta forma lo necesario para una correcta interpretación de los datos. Con un simple ejemplo entenderemos mejor a que se refiere el concepto de metadatos. Supongamos que tenemos la siguiente tabla de datos:

Tabla de datos procedente de Mendoza (2008)

En ella podemos intuir una posible estructura en la que existen varios registros que presentan valores para una serie de variables. Entre las variables intuimos que la primera columna se refiere a la fecha; la tercera puede ser la especie y quizás la segunda pueda ser algún tipo de tratamiento o localidad. Sin embargo en las tres últimas columnas no sabemos nada de esos valores. Pero en definitiva estamos asignando unos valores a una serie de variables de forma intuitiva, sin un criterio. Solo quien tomó los datos sabe a que se refiere cada columna. Si esa misma tabla la presentamos de la siguiente forma:
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

Ahora vemos claramente en cada registro que valor corresponde a que tipo de variable. En este caso, los metadatos se refieren a cada una de las variables. Además sobre esa tabla de datos podemos aportar documentación que nos aporta información necesaria para una mejor compresión de los datos, en el ejemplo: área de estudio, como se calculan las variables, que significan los códigos y en base a que criterios se han establecido, etc.

La importancia de los metadatos radica en la propia naturaleza de los datos. Los datos ecológicos presentan, de forma genérica, una serie de características que han de ser consideradas a la de la implementación de un sistema de metadatado. Entre ellas encontramos siguientes: 1. Heterogeneidad. Los datos ecológicos exhiben un rango heterogéneo de formatos, reflejando los diferentes motivos subyacentes a la colección de datos (Fegraus et al. 2005). Es fácil entender la variedad de datos ecológicos existentes existiendo variables muy diversas. Tenemos datos de biomasa de fitoplancton, porcentaje de semillas germinadas, patrones de precipitación en comunidades semiáridas, estudios de biodiversidad marina,

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. consumo de CO2 por la vegetación, y un inimaginable conjunto de datos diferentes. 2. Diferentes escalas. Dentro de los estudios ecológicos se atiende a diferentes escalas temporales (desde datos puntuales a series temporales), geográficas (experimentos en parcelas pequeñas hasta análisis de vegetación regional) y taxonómicas (estudios en un taxón hasta patrones de floración de una familia). 3. Dispersión de los datos. Datos sobre la misma temática no están centralizados ni existen catálogos de los mismos, sino que se presentan en las diferentes estaciones o centros de investigación. Por otro lado, hemos de considerar que existe una tendencia natural en la que los datos se degradan con el tiempo respecto al contenido de información (Michener et al. 2006). Es decir, existen una serie de procesos de pérdida del contenido de la información original con el tiempo (es lo que se conoce como entropía de la información) (Michener et al. 1997). En la siguiente figura se muestra como evoluciona la información contenida en los datos en un sistema que no utiliza metadatos.

Entropía de la Información contenida en los datos.

La tasa de perdida aumenta tras la publicación de los datos o la finalización de un proyecto. Además primero se pierden los detalles específicos (notas olvidadas en
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. el cuaderno de campo; archivos digitales que no sabemos donde están; nuestra memoria es corta, etc.) de los datos; mientras que los detalles generales se pierden con el tiempo debido a la degradación de los medios de almacenamiento, la perdida de memoria, etc., ya que estos detalles generalmente no se cubren en las publicaciones.

2 Beneficios de la utilización de metadatos
Existen varios autores que apuntan detalladamente los beneficios de la utilización de los metadatos en la documentación de datos de recursos naturales (Michener et al. 1997, 2006; Servilla, 2004). De forma resumida, las principales razones que fundamentan su uso son: Los humanos tenemos una memoria corta. Se reduce la entropía de la información. Muchos científicos preservan solamente una parte de los datos originales sintetizados en forma de publicaciones. De tal forma si se utilizan metadatos esos detalles no se perderían con el tiempo. Se aumenta la longevidad de los datos, ampliando la escala temporal de los mismos. Los datos colectados originalmente para un proyecto específico se pueden integrar posteriormente en proyectos con escalas de largo plazo. Reutilización de los datos. Unos datos adecuadamente documentados (con unos buenos metadatos) en los que se incluyan los procedimientos de muestreo y de análisis, la estructura del conjunto de datos, las anomalías observadas en los valores (ej.: valores extremos) nos ayudan a asegurar que los datos originales puedan ser reutilizados y/o reinterpretados con posterioridad. Se facilita el intercambio de datos entre científicos, sin necesidad de ser de la misma disciplina. Se pueden llevar a cabo metanálisis y realizar síntesis basadas en amplios datos. Cualquier científico que haya intentado hacer o haya hecho algún trabajo de metanálisis comentará que uno de los aspectos mas laboriosos

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. ha sido el de recopilación y comprensión de los datos fuente usados para la ejecución del metanálisis. Interoperabilidad de sistemas. Los datos ecológicos son muy complejos, por lo que han de estar dotados de una buena documentación para que diferentes sistemas puedan utilizarlos. Capacitación para aplicaciones analíticas avanzadas (flujos de trabajo, integración de datos, etc). A la hora de integración de datos por diferentes software unos datos acompañados de unos metadatos facilitaran la ingestión y tratamiento de los mismos. Se pueden generar repositorios de información ecológica. Estos benefician por un lado a la institución o grupo de investigación que los implemente (se reduce el tiempo invertido por los investigadores en la documentación previa a cualquier estudio, etc.), pero también benefician a la comunidad científica, entre otras cosas porque se facilita el uso secundario de los datos: metanálisis, flujos de trabajo y otras tantas aplicaciones analíticas avanzadas. Expansión de la escala ecológica.

3 Cantidad de metadatos
Una vez comprendida la necesidad de implementar metadatos para la documentación de datos dentro de un sistema de información (Bonet & San Gil, 2010; Bonet et al. 2010), la siguiente pregunta se refiere a la cantidad de información que han de contener los metadatos. La respuesta es sencilla, “cuanto mas mejor”, aunque se debe buscar un equilibrio entre el esfuerzo que nos supone la documentación de nuestros datos con el objetivo de la operación de documentado que aportará un valor añadido (derivado) a los datos (reutilización de los datos, metanálisis, etc.). Algunos autores han comprobado que al principio la documentación de los datos es costosa en cuanto a tiempo, aunque los investigadores una vez familiarizados con los procedimientos de creación de metadatos no suelen tardar mas de 30 minutos en documentar sus datos (Fegraus

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. et al., 2005). La cantidad de información que podemos aportar cuando estamos documentando nuestros datos va a depender de nuestro criterio y del tipo (formato) de datos a documentar. Es importante introducir aquí el concepto de los niveles de completitud. Se trata de una escala jerárquica que nos indica la completitud de nuestros metadatos y que se relaciona con la utilización de los datos. Algunos autores han propuesto diferentes niveles (Hook et al, 2007) pero de forma genérica podemos establecer tres niveles de completitud: nivel descriptivo-bibliográfico; nivel de descubrimiento; y nivel de integración (San Gil, 2010). La diferencia entre ellos radica en la cantidad de información que documentamos y su potencialidad de utilización. Llegando a completar el primer nivel tendremos la documentación mínima para que el conjunto de datos se integre en un catalogo o repositorio de datos y puede ser adecuadamente identificado o ubicado. En el segundo de los niveles, además de incluir el primero, contienen información sobre la cobertura de los datos (geográfica, temporal y taxonómica), permitiéndonos unas búsquedas de datos más avanzadas (i.e.: por taxón, por zona geográfica). En el tercer nivel se dan detalles completos de los datos: métodos, entidades-atributos de las tablas, formato de los datos, control de calidad de los datos, etc., con lo que se permite una integración semi o automática de los datos.

Cantidad de metadatos necesarios

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

En la figura anterior se resume la cantidad y estructuración de los metadatos necesarios respecto de la funcionalidad de los datos. Unos metadatos con bajo contenido y baja estructura podrán ser usados a nivel personal, aunque hemos de recordar que la memoria humana es corta. Podemos ver que existen tres tendencias claras: Aumento de la estructura. Podremos llegar a conocer todos los datos que tenemos porque se podrán integrar en un catálogo. Aumento del contenido. Aportar mucha documentación sobre nuestros datos permitirán tanto su reutilización en otros proyectos o investigaciones (metanálisis, etc.) como la realización de re-muestreos para ver el si el proceso observado ha sufrido cambios (cambio de uso de los datos: de investigación puntual a series de largo plazo –cambio climático, patrones temporales–). Aumento del contenido y de la estructura. Esta permitirá diferentes funcionalidades de los datos: intercambio con otros científicos (colegas o de otros ámbitos del proyecto). También permitirá la publicación de los datos y la interoperabilidad (flujos de trabajo).

4 Estándares de Metadatos
Supongamos que tenemos unos datos publicados en un artículo científico. Dichos datos presentan algunos de sus metadatos de forma asociada en los apartados de metodologías de dicho artículo. Aunque no contiene todos los metadatos necesarios sobre dicha tabla de datos, la información incluida en los métodos se pueden considerar metadatos de la tabla, aunque estos metadatos no presentan una estructura común y clara.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

Los estándares proporcionan un conjunto común de términos comprensibles para describir los datos, es decir, son como unos contenedores en los cuales introducimos algunos de los metadatos, de tal forma que cuando nos referimos al contenedor A, todos sabemos que tipo de información podemos obtener al analizar dicho contenedor. De esa forma estamos facilitando la entrada y recuperación de datos y metadatos; y con el uso de estándares se está dando soporte para que sean usados en operaciones automáticas de entrada, búsqueda, integración y síntesis. Se permiten operaciones crosswalk, etc. Cuando utilizamos estándares estamos expresando los metadatos de forma estructurada.

Existen diferentes esquemas o estándares de metadatos que establecen una serie de criterios fijos para la descripción de los datos. Estos estándares o modelos de metadatos varían en función del propósito y de la disciplina científica: biodiversidad (TDWG, Biodiversity Information Standart), información geográfica (Content Standards for Digital Geospatial Metadata, U.S. Federal Geographic Data Committee; normas ISO 19115), Ecological Metadata Languague (EML), entre otros.

A continuación se describen brevemente algunas características de algunos de ellos.

ISO19115 ISO19115 es una norma internacional de metadatos que define los elementos de los metadatos, proporciona un modelo de metadatos y establece un conjunto común de terminología, definiciones y procedimientos de ampliación para
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. metadatos (Dobarro et al 2007). Su principal objetivo es proporcionar una estructura definitiva y única para describir datos geográficos digitales. Las ventajas de su implementación son (Clerigué et al 2005): • • • • proporciona a los productores de los datos la información necesaria para describir correctamente sus datos. facilita la organización y el mantenimiento de los metadatos de datos geográficos. Permite a los usuarios utilizar los datos geográficos de una forma más eficiente, porque conocerán sus características básicas. Facilita el descubrimiento, la recuperación y la reutilización de los datos. A los usuarios les será más fácil localizar, acceder, evaluar, adquirir y utilizar los datos. • Permite a los usuarios determinar si los datos geográficos son útiles para ellos. Es una norma de referencia obligada para todo aquel que quiera tratar con metadatos, y define con detalle todos los aspectos relacionados con los metadatos. Para su correcta implementación es necesario el estándar ISO19139 que define cómo se deben codificar los metadatos ISO19115 sobre formato xml. En cuanto a los inconvenientes algunos autores apuntan que se trata de una norma muy extensa (401 ítems), compleja, poco acotada (Dobarro et al. 2007). Por ello dentro de este estándar existe el llamado ISO Core, que comprende un conjunto de metadatos del estándar ISO19115 considerados como más fundamentales o importantes en la documentación de los datos espaciales. Se trata con ello de permitir la posibilidad de acortar la tarea de catalogación de metadatos, que sería muy extensa si se atiende a los mas de 400 ítems del estándar, muchos de los cuales son demasiado específicos o difíciles de conocer (Clerigué et al 2005).

EML Basado en los trabajos pioneros de Michener et al. (1997) y de la Ecological Society of America se desarrolló un estándar para los datos ecológicos conocido
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. como EML (Ecological Metadata Language). Este estándar, mantenido por la red KBN (Knowledge Network for Biocomplexity), consiste en un lenguaje común implementado en XML que permite describir, archivar y transportar datos. Presenta una estructura modular, donde cada uno de los módulos esta diseñado para describir una parte lógica del total de los metadatos que deben ser incluidos en un conjunto de datos ecológicos. Entre sus características destacan: • • • • Cada modulo esta diseñado para describir una parte lógica del total de metadatos que deben ser incluidos en un conjunto de datos ecológicos Flexibilidad: La estructura modular que presenta le confiere flexibilidad y múltiples opciones de reutilización. Es extensible: puede ser utilizado para describir distintos tipos de datos. Permite el análisis de los datos en aplicaciones informáticas.

Estructura modular de EML.

EML es un estándar comprehensivo de metadatos que es particularmente aplicable para un amplio rango de datos ecológicos y esta suficientemente estructurado para soportar varios tipos de funciones automatizadas. Su organización en módulos aumenta la granularidad y la flexibilidad. Es un estándar que se adapta bien a distintas aplicaciones de la investigación, desde el simple descubrimiento de datos hasta avanzados procesamientos de datos; de esta forma proporciona un marco de trabajo para que los científicos narren de forma resumida descripciones ricas en semántica de sus metadatos y datos, incluyendo por ejemplo unidades de medidas, área de muestreo, etc. (Fegraus et al. 2005).
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. Pretende reducir la ambigüedad e incertidumbre mediante la formalización de los metadatos en un conjunto, comprensivo y estandarizado, de términos y definiciones proyectadas específicamente para datos ecológicos. Es importante destacar que incorpora diferentes elementos de otros estándares, tales como: Dublin Core; Perfil de Datos Biológicos (BDP) del FGDC; ISO 19115; Darwin Core; Geography Markup Language (GML), lo cual le permite cierta interoperabilidad con estos estándares. Este estándar está siendo utilizado dentro de la Red Internacional de Seguimiento Ecológico a largo plazo ILTER (International Long-Term Ecological Research) y tiene un gran desarrollo y continuas actualizaciones. En la red LTER-US los datos están documentados con este estándar. De igual modo se ha incorporado dentro de la implementación de los metadatos en la iniciativa GBIF (Global Biooiversity Information Facility). Existen diversas herramientas para la creación de metadatos siguiendo el estándar EML, destacando los editores de metadatos Morpho, MetadataEditor y el paquete de herramientas desarrollado por GBIF para la documentación de los datos.

Núcleo Español de Metadatos (NEM) y Directiva INSPIRE INSPIRE es el nombre de la Directiva 2007/2/CE, de 14 de marzo de 2007, por la que se establece una infraestructura de información espacial en la Comunidad Europea. Esta Directiva es de aplicación para datos y servicios espaciales referentes al territorio de la UE, en poder de las Administraciones Públicas de los estados miembros, comprendidos en los temas especificados en sus Anexos I, II y III. Uno de sus elementos clave es la generación de metadatos conformes a unos requerimientos fijados por las reglas de implementación (IR) de la misma Directiva. INSPIRE, mediante sus Reglas de Implementación, viene a solventar el problema de una base legal y técnica común para todos los estados miembros de la unión Europea, para poner orden y concierto en cuanto a la estandarización de los metadatos (Ortíz et al, 2008).

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. El Nucleo Español de Metadatos (NEM) se define como un conjunto mínimo de metadatos entendidos como un perfil de ISO 19115:2003 de acuerdo con el concepto de perfil definido en la Norma ISO 19106 “Geographic InformationProfiles”, es decir, es un modo particular y concreto de aplicar y utilizar una Norma, seleccionando un conjunto de items y un conjunto de parámetros opcionales. Para ello este perfil va a tener en cuenta otras iniciativas y acciones relevantes que en la actualidad se están desarrollando en materia de metadatos. Este perfil constituye por lo tanto un núcleo “Core”, conjunto de metadatos “mínimo” aconsejable por su utilidad y relevancia que va a permitir realizar (búsquedas, comparaciones,..) a partir de metadatos que proceden de diferentes fuentes, sobre distintos conjuntos de datos, de una manera rápida, práctica, fácil y fiable. Se define, para ser utilizado por todos los catálogos generados en las diferentes organizaciones relacionadas con la información geográfica de manera que se consiga la interoperabilidad de metadatos en toda España. No es, por lo tanto, un perfil normativo o restrictivo, no se pretende que se implemente directamente sino que se aconseja su utilización, cada institución u organismo debe estudiar cuales son los metadatos que considera adecuados para satisfacer sus necesidades, y una vez establecidos se recomienda incluir al menos los ítems que establece el perfil NEM, garantizando así la compatibilidad con el resto de iniciativas (Sánchez-Maganto et al. 2005; Ballarí et al. 2008). Se caracteriza por ser un perfil: • • Consolidado: aprobado por el Consejo Superior Geográfico. Consensuado: resultado de un amplio consenso, a partir de opiniones, comentarios y aportaciones de un grupo abierto de expertos en la materia pertenecientes a diferentes organizaciones e instituciones en el ámbito nacional, autonómico y local. • Estable: no va a ir incorporando nuevos ítems conforme vayan surgiendo iniciativas en el mundo de los metadatos, sino que se mantendrá razonablemente invariable. • No restrictivo: no pretende que se implemente directamente tal y como se define, sino que cada organismo o institución en función de sus
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. necesidades y la finalidad que persiga, establezca los metadatos que necesita y se recomienda que se incluya al menos los items definidos por NEM. Existen algunas herramientas para la creación de metadatos conforme a NEM, como por ejemplo el editor de metadatpos CatMDEdit, que está desarrollada como proyecto Open Source (código abierto), multilingüe, multiplataforma y compatible con otros estándares o normas de metadatos.

5 Algunas aproximaciones actuales de metadatado dentro de Sistemas de Información.
Cuando se piensa en un sistema de información ambiental es necesario atender a mecanismos de normalización, integración y procesado de datos brutos (Bonet & San Gil, 2010; Bonet et al. 2010, 2010b). Uno de los aspectos más importantes a la hora de gestionar la información es la documentación de los datos brutos, lo que se conoce como metadatado de la información. Algunas aproximaciones en este sentido consideran importante seguir una filosofía en la cual, primero se documentan los datos con el mayor detalle posible mediante algun sistema propio de metadatado, el cual puede tener en cuenta o no algunos estándares de metadatos. Con este metadatado se es capaz de generar catálogos con toda la información y realizar análisis complejos (ej. Bonet, 2010; Bonet & Pérez-Luque, 2010). Posteriormente, una vez bien documentados los datos para uso interno, se pueden realizar procesos de mapeo y validación con estándares internacionales de metadatos, lo cual permitirá comunicarse con otras redes o iniciativas nacionales o internacionales que usen un estándar de metadatos específico (San Gil, 2010). Algunos ejemplos se están llevando a cabo desde la iniciativa GBIF o en el Observatorio de Cambio Global de Sierra Nevada (Bonet et al. 2010; Pérez-Luque et al. –datos sin publicar-)

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

Sistema de Metadatos del Observatorio de Cambio Global de Sierra Nevada (SiMetOb) Dentro del Sistema de Información del Observatorio de Cambio Global en Sierra Nevada (Bonet, 2010; Bonet et al. 2010b) se ha desarrollado una aproximación para el metadatado de la información capaz de documentar los datos a diferentes niveles de completitud. Nuestro objetivo fundamental en esta tarea ha sido diseñar e implementar un sistema de "metadatado" que permita documentar toda la información existente en el sistema. Con toda esta "metainformación" se ha elaborado un catálogo o repositorio de metadatos, que nos permite la consulta de manera ágil toda la documentación asociada a los distintos elementos del sistema. Este sistema de metadatado, llamado SiMetOb (SIstema de METadatos del Observatorio de Cambio Global en Sierra Nevada) (Pérez-Luque et al., -datos sin publicar-) tiene su fundamento en la necesidad de tener bien documentada toda la información que se maneja y que se genera dentro del proyecto, con el objetivo de su utilización a nivel interno y su replicación a nivel externo del proyecto. Este sistema de metadatos contempla, por un lado la documentación semiautomática de datos brutos almacenados en bases de datos relacionales normalizadas, así como la documentación de otro tipo de información (textos, diapositivas, protocolos, etc.). Por otro lado el sistema de metadatos se ha diseñado atendiendo a varios estándares internacionales de metadatos, lo que hace que nuestro

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. catalogo de metadatos sea replicable en otros catálogos regionales, nacionales e internacionales. La edición de metadatos, tras revisar los editores de metadatos existentes, se realiza mediante un sistema propio. En este sentido, la aproximación consistió en: i) documentar toda la información con un formato interno que permitiera su utilización dentro del sistema de información, ii) almacenar los metadatos en un catálogo consultable, iii) exportar los archivos de metadatos en diferentes estándares internacionales previa validación del cumplimiento de éstos, y iv) replicación de los metadatos en diferentes catálogos de administraciones públicas y de iniciativas internacionales. En la siguiente figura se muestra un esquema del diseño y funcionamiento del Sistema de Metadatos SiMetOb. De esta forma se documenta la información adecuándola a las necesidades locales y luego se comunica con otros estándares mediante diferentes herramientas (San Gil, 2010).

Esquema de funcionamiento de SiMetOb

Los diferentes tipos de información entran al sistema y son documentados de forma semiautomática (algunos datos mediante formularios y otros

automáticamente). Esto se realiza vía web mediante el Sistema de Información del
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. Observatorio de Cambio Global dentro del apartado de metadatos. En la siguiente imagen se muestra un ejemplo de formulario de metadatado de la información.

Formulario de metadatos

Para la elección de los campos de metadatos a rellenar se realizó previamente un análisis de los diferentes estándares de metadatos. Los campos implementados en SiMetOb han considerado principalmente dos estándares: EML (Ecological Metadata Languague) y NEM (Nucleo Español de Metadatos). De esta forma el sistema de metadatos que hemos diseñado presenta una doble vertiente en cuanto a su compatibilidad, esto es: científica y de gestión. Es decir, nuestros datos se puede comunicar con la comunidad científica al tener los datos documentados de acuerdo al estándar de metadatos que tienen establecido; y al mismo tiempo son fácilmente integrables con las administraciones ambientales (REDIAM, a nivel regional) encargadas de la gestión de los recursos naturales, ya que utilizamos el mismo lenguaje de metadatos. Una vez documentada la información con los metadatos propios estos se almacenan en un catálogo implementado dentro del Sistema de Información. Este catálogo está basado en el estándar de metadatos EML, con lo que los metadatos de SiMetOb han de ser convertidos a dicho estándar. Así, se realiza una validación de los metadatos mediante un parser desarrollado por la KBN (Knowledge Network for Biocomplexity). El catálogo de metadatos está construido con el software MetaCat, también desarrollado por la KNB. De tal modo dentro del Observatorio de Cambio Global tenemos implementado un Metacat que actúa de
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. catálogo interno, aunque también, como veremos mas adelante es el medio para replicarnos en otras iniciativas internacionales.

Catálogo de Metadatos

Desde este catálogo los usuarios pueden consultar la información gracias a los metadatos. Se pueden realizar consultas mediante búsquedas de texto, o mediante búsquedas espaciales a través de un visor de mapas implementado en el propio catálogo. Los resultados que obtienen los usuarios al realizar las búsquedas ya presentan una estructura de acuerdo al estandar EML (un archivo xml), aunque se muestran mediante plantillas HTML. En ellos se pueden ver los datos referentes al responsable de los datos, el título del conjunto de datos, abstract, palabras claves, quien proporciona los datos, responsable de metadatos, etc. Estos resultados además contienen archivos con los metadatos de la estructura de las tablas de datos contenidas en la información documentada. De tal modo que se puede consultar características como: atributos de las tablas, relaciones entre los atributos, atributos claves, tipo de atributos, etc. También se permite la descarga del archivo de metadatos en formato EML (xml) con lo que se posibilita la integración de la información en diferentes aplicaciones, como por ejemplo en flujos de trabajo automatizadaos (ej.: Kepler), en repositorios de modelos, etc.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. En la siguiente imagen se muestra el HTML que se obtiene al realizar una búsqueda. Como se puede ver existen diferentes archivos de metadatos asociados dentro del propio archivo original de metadatos.

Ejemplo de resultados de la búsqueda en el Catálogo de Metadatos. El archivo que se muestra ya presenta formato EML.

Interoperabilidad del Sistema con otros estándares SiMetOb presenta una característica clave: flexibilidad. Es un sistema de metadatos flexible que permite su conversión a otros estándares de metadatos. Hasta ahora tenemos implementado tres conversiones: • Formato EML. Se exportan los datos de acuerdo al estándar internacional EML. Cuando se ha realizado esta conversión, el archivo de metadatos es validado con una herramienta (parser) gestionada por los desarrolladores del EML. De esta forma se realiza un control de calidad de los metadatos, para ver si éstos cumplen los requisitos exigidos por el estándar. El archivo en formato EML, ya validado, se ofrece dentro de la web Sistema de Información Linaria en el apartado de metadatos. Con esta conversión se atiende a la necesidad de comunicación mediante metadatos dentro de la comunidad científica internacional.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

Vista de la estructura del archivo de metadatos en formato EML

Formato INSPIRE. En este caso los metadatos son validados de acuerdo a la Directiva INSPIRE. Para ello se utiliza la herramienta INSPIRE Metadata Validator. De esta forma, los metadatos están capacitados para utilizarse dentro de cualquier Infraestructura de Datos Espaciales dentro de las Administraciones Públicas de la Unión Europea.

Formato Rediam. Se trata de una aplicación específica del Núcleo Español de Metadatos (NEM). La Red de Información Ambiental de Andalucía utiliza el NEM para documentar sus metadatos. Para facilitar la tarea de documentación de la información elaboró unas directrices de catalogación de la Información Ambiental (Marquez-Arroyo, 2009), que son las que se han tenido en cuenta para exportar nuestros metadatos en el formato que hemos llamado Rediam. Para ello se utiliza una hoja de estilos que convierte los archivos xml de los metadatos y los exporta en el formato que acepta la Red de Información Ambiental de Andalucía.

Vista de un archivo de metadatos de SiMetOb de acuerdo al estilo de la Rediam

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

Replicación de los Metadatos de SiMetOb en otros catálogos. Debido a las características mencionadas del Sistema de Metadatos que hemos diseñado e implementado, los metadatos del Observatorio de Cambio Global de Sierra Nevada son capaces de replicarse en otros catálogos internacionales. Actualmente se está en proceso de integración en los siguientes catálogos: • Red LTER-US. Se trata de la red americana de seguimiento ecológico a largo plazo. Tienen un catálogo de metadatos que aglutina miles de archivos de metadatos procedentes de los diferentes sitios de seguimiento que tienen distribuidos por todo el continente americano. El estándar con el que trabaja es EML. Para su inclusión de nuestros metadatos se ha tenido que realizar una validación de los mismos y la asignación de un identificador del sitio proveedor. En este caso, al Observatorio de Cambio Global en Sierra Nevada se le ha asignado el identificador lter-spainsierranevada. • NBII (National Biological Information Infraestructure). La iniciativa NBII ha puesto en marcha un clearinhouse, que es un agregador de registros de metadatos de diferentes organizaciones científicas que deseen

proporcionar sus metadatos allí para ser buscados. Se trata de un potente buscador para científicos que les permite compartir y acceder a gran cantidad de información referente a la investigación científica en recursos naturales. Actualmente estamos en proceso de replicación de nuestros metadatos en dicho repositorio. • Rediam. Nuestros metadatos están capacitados según el perfil NEM, lo que les permite incorporarse al catálogo de metadatos de la Rediam, previa aplicación del estilo que dicha red tiene acotado dentro de su catalogo de metadatos. Actualmente estamos en proceso de replicación de nuestros metadatos en dicho repositorio • Otros. Al ser flexible nuestro sistema de metadatos se puede replicar en otros catálogos que utilicen estándares internacionales. Entre ellos

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. podemos destacar: Infraestructuras de datos Espaciales, Portal de Metadatos de GBIF, etc.

Como citar este documento: Pérez-Luque, A.J. (2010). Introducción a los Metadatos en Ecología. In: “Ecoinformática”. Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”. Universidad de Granada. Nov. 2010. Disponible en http://sl.ugr.es/ajpelu_metadatos_master2010texto

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología.

6 Bibliografía.
Aguilar, R.; Pan, J.; Gries, C.; San Gil, I. & Palanisamy, G. (2010). A flexible online metadata editing and management system. Ecological Informatics, 5 (1):26-31. Alonso, B. & Valladares, F. (2006). Bases de datos y metadatos en ecología: compartir para investigar en cambio global. Ecosistemas, 15 (2): 83–88. Ballari, D.; Sánchez-Maganto, A.; Nogueras-Iso, J.; Rodríguez-Pascual, A. & Bernabé, M.A. (2006). Medidas para impulsar la utilización del Núcleo Español de Metadatos (NEM). In C. Granell-Canut & M. Gould Carlson, (Eds.) Avances en las Infraestructuras de Datos Espaciales. Treballs d’Informàtica i Tecnología, 26. Castellón, España, 61–72. Bonet-García, F.J. (2010). Converting field data into knowledge: towards adaptative management in Sierra Nevada LTER site. In 2ª International GMBADIVERSITAS Conference “Functional significance of mountain biodiversity”. Chandolin, Switzerland. 27 - 30 Julio. Conference abstracts, p. 42 Bonet, F.J. & Pérez-Luque, A.J. (2010). Relationship of snow cover and vegetation structure in Sierra Nevada (Spain), a Mediterranean mountain. In Global Change and the World's Mountains. Perth, Scotland. 26-30 Sep. 2010. Bonet-García, F.J. & San Gil, I. (2010). Gestión de la información ambiental en los espacios protegidos y 19 en las (2): redes 89 de – seguimiento 96. del cambio en

global. Ecosistemas,

Disponible

http://www.revistaecosistemas.net/pdfs/638.pdf Bonet, F.J.; Pérez-Luque, A.J.; Moreno, R. & Zamora, R. (2010). Observatorio de Cambio Global en Sierra Nevada. Estructura y contenidos básicos. Consejería de Medio Ambiente, Junta de Andalucía - Universidad de Granada. [Online]. Disponible en: http://www.scribd.com/doc/32239398/Observatorio-Sierra-

Nevada-Datos-basicos Bonet, F.J.; Pérez-Luque, A.J. & Pérez-Pérez, R. (2010b). Linaria: an information system to implement GLOCHAMORE project and promote conversion of information into knowledge in Sierra Nevada Biosphere Reserve.. In Global Change and the World's Mountains. Perth, Scotland. 26-30 Sep. 2010.
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. Clerigué, R.; Echamendi, P.; Fontano, S. & Sabando, C. (2005). Integración de metadatos en un sistema de información corporativo: La IDE de Navarra. In 6th Semana Geoinformática. 8 a 11 de febrero de 2005. Barcelona. Cook, R.B.; Olson, R.J.; Kanciruk, P. & Hook, L.A. (2001). Best Practices for Preparing Ecological Data Sets to Share and Archive. Bulletin of the Ecological Society of America, 82 (2): 138–141. Dobarro, A.; Luaces, M. R. & Paramá, J. R. (2007). Componentes para la gestión del catálogo y los metadatos de un sistema de información geográfica. In La Infraestructura de Datos Espaciales de España en 2007. Proyectos, servicios y nodos (JIDEE 2007), Grupo76, Santiago de Compostela (España), 2007, pp. 60-72. Fegraus, E.H., Andelman, S., Jones, M.B. & Schildhauer, M., (2005). Maximizing the Value of Ecological Data with Structured Metadata: An Introduction to Ecological Metadata Language (EML) and Principles for Metadata

Creation. Bulletin of the Ecological Society of America, 86 (3): 158–168 Garg, S. (2005). Ecological Metadat Language modules and their uses. Second KNB Data Management Tools Workshop. University of New Mexico. Albuquerque. Hook, L.A.; Beaty, T.W.; Santhana-Vannan, S.; Baskaran, L.; Cook & R. B. (2007). Best Practices for Preparing Environmental Data Sets to Share and Archive. [Online]. Disponible en: http://daac.ornl.gov/PI/bestprac.html Jones, M.B., Berkley, C., Bojilova, J. & Schildhauer, M. (2001). Managing scientific metadata. Internet Computing IEEE, 5 (5): 59–68. Jones, M.B., Schildhauer, M.P., Reichman, O.J. & Bowers, S. (2006). The New Bioinformatics: Integrating Ecological Data from the Gene to the

Biosphere. Annual Review of Ecology, Evolution, and Systematics, 37 (1): 519– 544 Leinfelder, B.; Tao, J.; Costa, D.; Jones, M.B.; Servilla, M.; O'Brien, M. & Burt, C. (2010) A metadata-driven approach to loading and querying heterogeneous scientific data. Ecological Informatics, 5 (1):3 – 8

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. Márquez-Arroyo, M. (2009). Directrices para la catalogación de información ambiental. Red de Información Ambiental de Andalucía. Documento inédito (EGMASA). Michener, W.K., Brunt, J.W., Helly, J.J., Kirchner, T.B. & Stafford, S.G. (1997). Nongeospatial metadata for the ecological sciences. Ecological Applications, 7 (1):330-342. Michener, W.K. & Brunt, J.W. (Eds.) (2000). Ecological Data: Design, Management and Processing. Oxford: The seminal paper Blackwell. 180 pp. Michener, W.K. (2006). Meta-information concepts for ecological data

management. Ecological Informatics, 1 (1): 3–7. Ortíz, L.; Zabala, A. & Casanovas, P. (2008). Generación de metadatos según las Reglas de Implementación de metadatos de la directiva INSPIRE en el marco del Departament de Medi Ambient i Habitatge (DMAH) de la Generalitat de Catalunya. Algunas consideraciones. In Jornadas Técnicas de la

Infraestructura de Datos Espaciales de España (JIDEE 2008), 5 – 7 Noviembre. Tenerife. Pérez-Luque, A.J.; Pérez-Pérez, R.; Bonet-García, F. (unpublished). Sistema de Metadatos del Observatorio de Cambio Global en Sierra Nevada. San Gil, I. (2010). EML (Ecological Metadata Languague): El lenguaje de metadatos ecológicos. Curso organizado por Red LTER-Spain y ICTS-Doñana. Sevilla, 16 – 18 Junio. Sánchez-Maganto, A.; Nogueras-Iso, J. & Ballari, D. (2008). Normas sobre metadatos (ISO19115, ISO19115-2, ISO19139, ISO 15836). Mapping, 123: 48– 57. Sánchez-Maganto, A.; Rodríguez-Pascual, A.; Abad-Power, P. & López-Romero, E. (2005). El Núcleo Español de Metadatos, perfil mínimo recomendado de metadatos para España. In Jornadas Técnicas de la IDE de España. Madrid. Servilla, M. (2004). An Introduction to Metadata. KNB Data Management Tools Workshop. University of New Mexico. Albuquerque. Subgrupo de Trabajo del Núcleo Español de Metadatos (2005). Núcleo Español de Metadatos (NEM v1.0).
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada

Introducción a los Metadatos en Ecología. Yang, Z. & Henshaw, D. (2007). Generating EML from a Relational Database Management System (RDBMS). LTER DataBits, Spring: 13–18.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad” Asignatura: Ecoinformática - Universidad de Granada