DISEÑO Y CREACIÓN DE UN REPOSITORIO DE MODELOS PARA LA RED DE INFORMACIÓN AMBIENTAL DE ANDALUCÍA
Introducción
En los últimos años, gracias al desarrollo de las tecnologías de comunicación y lasinfraestructuras de datos distribuidos, se ha incrementado la necesidad de interfasesadaptables y herramientas para acceso a datos y ejecución de análisis complejos. Estetipo de análisis pueden ser modelados como
flujos de trabajo
descritos en un lenguajeformal.En este contexto se está produciendo un importante avance en el desarrollo desistemas de diseño y ejecución de
flujos de trabajo
, capaces de proveer desde unmismo interfaz acceso a los datos, servicios y módulos de computación necesariospara cualquier tipo de análisis.Sistemas de estas características tienen una gran penetración en el sector académico,y en investigación genética y farmacológica, ya que posibilitan recogida,estructuración, procesamiento de grandes masas de datos y análisis y publicación delos resultados sin necesidad de recurrir a expertos en tecnologías de la informaciónque diseñen los sistemas de análisis desde cero.Las características modulares de estos sistemas y la implementación de protocolos detransferencia de datos estandarizados los hacen muy flexibles para cualquier tipo deanálisis, y esta flexibilidad le abre hueco en cualquier campo para el que se encuentreaplicación.En el presente trabajo analizamos en profundidad el sistema Kepler, una prometedoraherramienta a tener en cuenta en el campo del análisis y gestión medioambiental.
¿Qué es Kepler?
Kepler (http://kepler-project.org/) es un proyecto colaborativo (ver cuadro 1), de códigoabierto, que pretende proporcionar un “entorno de modelado y resolución deproblemas”. Mas concretamente, se trata de un sistema diseñado para crear modelosejecutables utilizando una representación visual de los procesos que implican. Larepresentación gráfica de estos modelos, también llamadas flujos de trabajo muestrael flujo de datos entre los distintos componentes del análisis.Kepler está especialmente diseñado para dar soporte al flujo de datos en distintosdominios técnicos y científicos, como la bioinformática, la ecoinformática y lageomática entre otros, pero sus características pueden ser aplicadas a cualquiercampo que requiera flujos de trabajo con datos para resolver problemas.Kepler combina perfectamente el diseño de alto nivel de flujos de trabajo con laejecución e interacción en tiempo real, acceso a datos locales y remotos, invocaciónde servicios locales y remotos, con un control interno de concurrencia y un mecanismode planificación. El sistema proporciona características para monitorizar la ejecuciónde flujos de trabajo, recuperación de fallos, y control de origen de servicios y datos.Kepler se basa en el sistema Ptolemy II (http://ptolemy.berkeley.edu/ptolemyII/),desarrollado en la Universidad de Berkeley. Este proyecto estudia el diseño eimplementación de sistemas de computación, enfocándose en el ensamblado decomponentes concurrentes. La clave del proyecto es la utilización de modelos de
ANÁLISIS Y EVALUACIÓN DEL SISTEMA KEPLER
1
Add a Comment