You are on page 1of 112

Software de fuentes abiertas

en la Administración electrónica
Archivo electrónico de las Administraciones Públicas
Elaborado por:
Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas
(CENATIC).
Atos Consulting

Con la colaboración de:


Ministerio de Industria, Turismo y Comercio, Ministerio de la Presidencia,
Ministerio de Economía y Hacienda, Ministerio de Defensa, Red.es,
Dirección General de Tráfico, Generalitat de Catalunya, Gobierno de Aragón,
Gobierno de Cantabria, Junta de Extremadura, Junta de Andalucía,
Principado de Asturias, Diputación de Cáceres, Diputación de Teruel,
Ayuntamiento de Almendralejo, Ayuntamiento de Mérida, Ayuntamiento de Zaragoza

Edita:
© 2009 CENATIC
(Centro Nacional de Referencia de Aplicación de las TIC basadas en fuentes abiertas).
C/ Vistahermosa, 1-3ª planta
06200 Almendralejo (Badajoz)

Deposito legal: BA-322-09 Este informe está disponible en el sitio web de Cenatic
http://www.cenatic.es
Diseño y producción:
Comfot, s.l.u. Las opiniones expresadas en esta publicación
pertenecen a los distintos autores de los textos incluidos
Reservados todos los derechos. Se permite su copia y distribución por cualquier medio, siempre que se y no reflejan necesariamente la opinión de Cenatic, o de
mantenga el reconocimiento de sus autores y no se realice ninguna modificación de las mismas. las Administraciones Públicas.
Índice
1. Resumen ejecutivo 5

2. Introducción 9
2.1. Archivo de documentos electrónicos 11
2.2. Problemática relativa al Archivo Electrónico 12
2.3. Contexto actual del Archivo Electrónico 14
2.4. Expediente electrónico 16
2.5. Valor de los documentos 17
2.6. Documentación susceptible de ser archivada 18
2.7. Metadatos 19
2.8. Diferencias entre un Gestor Documental y un Archivo Electrónico 20
2.9. Ciclo de vida de los documentos 22

3. Modelo conceptual del Archivo Electrónico 23


3.1. Descripción del Modelo Conceptual 25
3.2. Aspectos clave del modelo 33
4. Aplicación del modelo conceptual a las AAPP 39
4.1. Flexibilidad del modelo de Archivo Electrónico propuesto 41
4.2. Escenario 1 41
4.3. Escenario 2 43
4.4. Normas internacionales 44

5. Definición funcional del Archivo Electrónico 47


5.1. El modelo OAIS 49
5.2. Adecuación del modelo OAIS 51

6. Implementación tecnológica del Modelo Conceptual 55


6.1. Alcance de la implementación 57
6.2. Contexto tecnológico 57
6.3. Soluciones de repositorio existentes basadas en software open-source 58
6.4. Diseño de la implantación piloto 71

7. Mapa de componentes 87
7.1. Identificación de categorías de componentes 89
7.2. Mapeo funcionalidad - componente 98

8. Glosario 107

4
01.
Resumen ejecutivo
Archivo electrónico de las Administraciones Públicas

1. Resumen ejecutivo

El documento se enmarca dentro de la iniciativa im- los distintos tipos de Administraciones Públicas
pulsada por el Centro Nacional de Referencia de existentes en España.
Aplicación de las TIC basadas en fuentes abiertas
(CENATIC) para analizar la problemática actual del ar- Este modelo segmenta el Archivo Electrónico en dis-
chivo de documentos electrónicos en las Administra- tintos niveles para favorecer una centralización de la
ciones Públicas. información y facilitar su alineación con la organiza-
ción existente.
En el mismo se presentan las conclusiones de las ac-
tividades realizadas durante el proyecto, que se han Cada uno de estos niveles actuará como un sistema
orientado hacía dos líneas de trabajo: independiente. Para la definición funcional de los ni-
veles se ha adoptado una división modular, en la que
Definir un modelo conceptual de Archivo Electró- se ha tomado como referencia el modelo OAIS de Ar-
nico adecuado a las necesidades de las Adminis- chivo Electrónico, aceptado a nivel mundial.
traciones Públicas.
Analizar la viabilidad de una implantación tec- El modelo propuesto ha sido contrastado con
nológica del modelo propuesto en el ámbito del representantes de los distintos ámbitos de la
software de fuentes abiertas. Administración Pública, lo que ha permitido per-
feccionar la aproximación inicial, ajustándola al en-
La definición del modelo conceptual se apoya en un torno y a las necesidades reales de los potenciales
análisis previo de la normativa existente, que ha per- usuarios.
mitido determinar las directrices que deberán regir la
operativa del Archivo Electrónico. Sobre ellas, se ha Complementariamente, se ha realizado un estudio
diseñado una propuesta válida y suficientemente para comprobar la viabilidad de la implantación del
flexible para dar respuesta a los requerimientos de modelo propuesto sobre una plataforma tecnológica

7
Software de fuentes abiertas en la Administración electrónica

formada exclusivamente por componentes de soft- Para solucionar estas carencias, se han buscado apli-
ware de fuentes abiertas. caciones y componentes de software de fuentes libres
complementarios que puedan ser integrados para
Se han evaluado distintas aplicaciones open-source conformar una implantación del Archivo Electrónico
de repositorio digital, confrontándolas con el modelo completa.
conceptual diseñado. Fruto de esta comparación, se
han identificado qué aspectos funcionales del modelo Los productos identificados se han recopilado en un
no quedarían cubiertos por una aplicación tipo de re- catálogo o mapa de componentes de software de
positorio digital. fuentes abiertas.

8
02.
Introducción
Archivo electrónico de las Administraciones Públicas

2. Introducción

2.1. Archivo de documentos electrónicos digital gestionada por los organismos públicos, los
cuales deberán disponer de sistemas adecuados que
El Archivo Electrónico se ocupa del almacenamiento y permitan almacenarla de una forma ordenada y eficaz.
conservación de documentos generados por medios
electrónicos. El archivo de documentación electrónica, como otros as-
pectos de la Administración Electrónica, viene regulado
Con la progresiva modernización de la Administra- por la LAECSP, a través de su artículo 31, que indica que:
ción Pública, cada vez es más habitual el empleo de
sistemas informáticos para la creación y distribución “Los medios o soportes en que se almacenen docu-
de documentación como parte de la operativa diaria mentos, deberán contar con medidas de seguridad
de las organizaciones. Esta informatización está origi- que garanticen la integridad, autenticidad, confiden-
nando una sustitución del soporte papel por otros for- cialidad, calidad, protección y conservación de los
matos digitales, lo que supone un cambio en la forma documentos almacenados. En particular, asegura-
de trabajar de los empleados públicos. rán la identificación de los usuarios y el control de
accesos, así como el cumplimiento de las garantías
En paralelo se está avanzando en la implantación de previstas en la legislación de protección de datos”.
mecanismos de relación entre los ciudadanos y las
administraciones a través de medios electrónicos, es- La LAECSP también define qué se entiende por docu-
pecialmente desde la aprobación de la Ley 11/2007, mento electrónico de archivo, como:
de Acceso Electrónico de los Ciudadanos a los Servi-
cios Públicos (LAECSP). “La información de cualquier naturaleza en forma
electrónica, archivada en un soporte electrónico
Como resultado, durante los próximos años se prevé según un formato determinado y susceptible de
un importante aumento en el volumen de información identificación y tratamiento diferenciado”.

11
Software de fuentes abiertas en la Administración electrónica

2.2. Problemática relativa al Archivo aplicaciones dejan de ser compatibles con la platafor-
Electrónico ma tecnológica actual.

Aunque el manejo de documentos en formato electróni- Estas actualizaciones de la tecnología, aunque fre-
co tiene ventajas en comparación a sus equivalentes en cuentes, no suelen implicar un riesgo para la operativa
papel, también es cierto que presenta nuevas problemá- cotidiana, donde los documentos electrónicos rara-
ticas relativas a su conservación que antes no existían. mente tienen una vigencia superior a un par de años, y
los cambios tienden a hacerse progresivamente.
2.2.1. Obsolescencia tecnológica
La problemática principal es que el uso de ficheros Sin embargo, cuando consideramos la conservación
electrónicos implica la dependencia respecto a una de documentos electrónicos durante largos periodos
infraestructura tecnológica. Esta infraestructura está de tiempo, esto puede convertirse en un problema.
formada por las aplicaciones y programas que son ca- Así, puede darse el caso, que el documento que archi-
paces de procesarlos y presentar los contenidos a los vamos hoy en un soporte y formato de fichero deter-
usuarios, así como por los componentes de hardware minado, no pueda ser recuperado dentro de 10 años,
sobre los que se ejecutan debido a causas como que las aplicaciones ofimáticas
no sean capaces de reconocer el formato empleado o
Es algo asumido que la tecnología evoluciona con rapi- simplemente porque el hardware no sea compatible
dez, lo que da lugar a la renovación constante de pro- con el soporte empleado.
ductos y aplicaciones por otros más modernos y com-
pletos. En la práctica esto obliga a las organizaciones a A modo de ejemplo, basta imaginar un fichero almace-
una continúa renovación de sus sistemas informáticos nado un disco de 5 ¼, una tecnología muy empleada
para mantener su infraestructura actualizada. durante los años 80. En la actualidad, es prácticamen-
te imposible encontrar un ordenador moderno que los
La obsolescencia tecnológica aparece cuando, fruto admita, por lo que la información que contiene puede
de esta evolución, versiones antiguas de los ficheros y darse por perdida.

12
Archivo electrónico de las Administraciones Públicas

Además hay que tener en cuenta que los ficheros in- caciones que rigen la representación de los conteni-
formáticos no son más que una secuencia de bits (ce- dos son públicas y accesibles para cualquiera, per-
ros y unos), que el software trata de acuerdo a unas mitiendo el desarrollo de software adecuado para su
especificaciones concretas, dando lugar a la repre- manejo en cualquier momento.
sentación esperada de los contenidos.
2.2.2. Clasificación y recuperación
Esto implica un riesgo al emplear formatos de fichero de la información
propietarios, cuyas especificaciones no hayan sido A medida que el volumen de información almacena-
publicadas por sus creadores, para el archivado a da aumenta, la identificación y recuperación de los
largo plazo. La recuperación de estos ficheros viene contenidos se hace más complicada. Esto es común
determinada por la existencia de soporte por parte tanto a la documentación en soporte electrónico
de sus creadores. Si la empresa cierra o abandona como a la generada en soportes físicos.
su desarrollo, nadie más será capaz de desarrollar
software que pueda procesar y recuperar estos fi- Durante años, los archiveros han establecido meca-
cheros. nismos para el etiquetado y clasificación de la infor-
mación, dando lugar a los archivos actuales existen-
En el mejor de los casos, es posible que sí exista tes en las Administraciones Públicas. La existencia
software compatible en el futuro pero que debamos de cuadros de clasificación, catálogos e índices
adquirirlo bajo las condiciones impuestas por el pro- hace que sea posible encontrar un documento en
ductor, limitando nuestra libertad para elegir con qué fondos documentales con miles de volúmenes.
herramientas queremos trabajar.
Los sistemas informáticos ofrecen mecanismos úti-
Por ello, la adopción de formatos basados en están- les para el usuario para la búsqueda y recuperación
dares abiertos y conocidos es un requisito impres- de ficheros en entornos de almacenamiento. Esto
cindible a la hora de abordar la implantación de un podría llevar a la conclusión de que el uso de méto-
Archivo Electrónico, ya que el conjunto de especifi- dos archivísticos no sigue siendo necesario.

13
Software de fuentes abiertas en la Administración electrónica

Sin embargo, estos mecanismos de búsqueda pierden Hay que tener en cuenta que la incorporación de un
efectividad y requieren de una mayor cantidad de pro- documento a un procedimiento administrativo le con-
cesamiento a medida que crece la cantidad de ficheros fiere un valor legal, por lo que es necesario garanti-
almacenados, por lo que sigue siendo imprescindible la zar la autenticidad y procedencia del documento. Por
catalogación de la documentación generada. ello, es imprescindible establecer los mecanismos
adecuados que permitan garantizar la integridad de
Los usuarios deben ser conscientes de ello y adoptar la información archivada, así como auditar todas las
una actitud proactiva al respecto, describiendo y eti- acciones que se han realizado sobre la misma y quién
quetando la información que generan, ya que no resul- las ha llevado a cabo.
ta viable dejar toda esta responsabilidad en manos de
los archiveros. Por otro lado, el uso de la tecnología persigue facilitar
la compartición y el acceso a la información por parte
Por ello, hay que evitar la percepción del Archivo Elec- de los usuarios. Dado el carácter confidencial de parte
trónico como algo relacionado únicamente con la ges- de los documentos incluidos en la tramitación admi-
tión de Sistemas Informáticos y favorecer la participa- nistrativa, es imperioso establecer métodos de auten-
ción de los archiveros en el desarrollo e implantación tificación y autorización que limite su difusión única-
de procesos de conservación de la documentación mente a los usuarios afectados por el procedimiento.
digital.

2.2.3. Seguridad de la información 2.3. Contexto actual del Archivo Electrónico


La seguridad es otra de las problemáticas respecto a
la conservación de documentos electrónicos. A dife- La LAECSP ha impulsado la implantación real de la
rencia del papel, un documento electrónico es fácil- Administración Electrónica en las Administraciones
mente modificable, pudiéndose añadir o eliminar par- Públicas españolas. La complejidad de estas iniciati-
tes del documento sin que se aprecien evidencias de vas y la limitación de recursos disponibles está favore-
los cambios. ciendo que esta implantación se lleve a cabo de forma

14
Archivo electrónico de las Administraciones Públicas

progresiva por fases, dándose prioridad a aquellos constatado que, en general, existe una sensación de
servicios más visibles por el ciudadano, como el regis- indefinición alrededor del Archivo Electrónico, propi-
tro electrónico o el inicio de trámites por vía telemáti- ciado en parte por una falta de regulación en algunos
ca, así como a aquellos sistemas que tienen un mayor de los aspectos claves que le afectan, como:
impacto en la gestión interna. Criterios a seguir para la conservación de los con-
tenidos.
En este contexto, el Archivo Electrónico no se está per- Qué información es obligatorio conservar.
cibiendo como una prioridad a corto plazo, ya que la Definición de responsabilidades sobre la preserva-
tecnología actual permite adoptar soluciones de contin- ción de la información electrónica.
gencia a bajo coste. Así, es habitual que las Administra- Definición de mecanismos para la interoperabilidad
ciones Públicas habiliten sistemas de almacenamiento con otros sistemas.
donde mantener la información digital generada sin
abordar el desarrollo de mecanismos que garanticen su Esto se refleja en una práctica inexistencia de solucio-
conservación a largo plazo. nes comerciales orientadas a dar respuestas eficaces
a esta problemática. De este modo, las Administracio-
Aunque esta aproximación puede ser válida a corto nes Públicas carecen de referencias sobre la dirección
plazo, no es asumible posponer la resolución de este a seguir.
problema indefinidamente, ya que, como se ha co-
mentado anteriormente, es inevitable la aparición de Como se ha podido comprobar durante el contraste
problemas relacionados con la obsolescencia de la del modelo, existen principalmente tres tendencias
tecnología en el futuro, comprometiendo el acceso a para abordar el archivo de documentos electróni-
los contenidos archivados. cos:
Implantar soluciones orientadas a automatizar
Esta percepción como problema a resolver en el fu- la gestión de documentación en papel, que aun-
turo, está retrasando un análisis exhaustivo en las que permiten el almacenamiento de información
Administraciones Públicas sobre su aplicación. Se ha digital, no entran a resolver su problemática. Es-

15
Software de fuentes abiertas en la Administración electrónica

tas soluciones suelen encontrarse en plataformas Archivo Electrónico orientado a la conservación a lar-
integrales de Administración Electrónica, como go plazo y a la implantación práctica de políticas de
SIGEM o W@nda, ampliamente adoptadas por En- preservación.
tidades Locales.
Ampliar la funcionalidad de los sistemas de Ges-
tión Documental existentes para habilitar ciertos 2.4. Expediente electrónico
mecanismos de preservación. Se ha constatado
que esta es la alternativa preferida por muchas Ad- El Expediente Electrónico es un concepto clave a la
ministraciones Regionales que ya disponen de sis- hora de abordar el estudio del Archivo Electrónico.
temas corporativos como Documentum o Alfresco. Así, puede verse como la representación en el entorno
Habilitar espacios de almacenamiento de do- digital del expediente administrativo, que no es sino
cumentos digitales, dejando la implantación de el conjunto de documentos, en los que la Administra-
políticas de preservación para más adelante. Esta ción basa sus decisiones y actuaciones sobre un tema
opción se da en Administraciones que generan vo- en concreto.
lúmenes de información reducidos.
Según la LAECSP, en su articulo 32, el expediente
En general, estas iniciativas tienden a impulsarse a electrónico se define como
través de departamentos de informática y sistemas, “El conjunto de documentos electrónicos corres-
siendo poco habitual la participación de personal rela- pondientes a un procedimiento administrativo,
cionado con el Archivo de la entidad en el proceso de cualquiera que sea el tipo de información que con-
diseño y definición. tengan”.

Como excepción cabe mencionar el proyecto iArxiu La LAECSP también indica cómo debe estructurarse:
emprendido por la Generalitat de Catalunya, a través “El foliado de los expedientes electrónicos se lleva-
de la Agència Catalana de Certificació (CATCERT), rá a cabo mediante un índice electrónico, firmado
para la definición e implementación de un sistema de por la Administración, órgano o entidad actuante,

16
Archivo electrónico de las Administraciones Públicas

según proceda. Este índice garantizará la integridad Otros contenidos como registros de Bases de Datos,
del expediente electrónico y permitirá su recupera- justificantes de transacciones electrónicas, etc.
ción siempre que sea preciso, siendo admisible que
un mismo documento forme parte de distintos ex- Hay que destacar que la digitalización de documenta-
pedientes electrónicos.” ción en papel tendrá consideración de copia auténtica,
pudiendo procederse a la destrucción de los origina-
En otras palabras, al hablar de expediente electróni- les, siempre que se cumplan los requisitos y actuacio-
co estamos refiriendo a un conjunto de documentos nes previstas en el artículo 46 de la Ley 30/1992, de
electrónicos que dan soporte a un procedimiento ad- Régimen Jurídico de las Administraciones Públicas y
ministrativo junto con un índice que los referencia y del Procedimiento Administrativo Común.
sirve como elemento integrador.
También es importante indicar que, aunque durante la
Esta aproximación nos permite, entre otras cosas, que tramitación administrativa, el expediente electrónico
un mismo documento pueda formar parte de distintos es un elemento “vivo”, al que pueden añadirse docu-
expedientes administrativos. mentación y editar la existente, cuando llega al Archivo
Electrónico, tanto el índice como los documentos que
Entre los contenidos que pueden formar parte del ex- contiene no podrán modificarse.
pediente electrónico se encuentran:
Documentos creados electrónicamente por las Ad-
ministraciones Públicas 2.5. Valor de los documentos
Digitalizaciones de documentos creados en forma-
to papel Los documentos, según la finalidad para la que fueron
Digitalizaciones de documentación aportada por producidos, podrán tener los siguientes valores:
los ciudadanos Valor primario: aquel que va unido a la finalidad in-
Documentos aportados por los ciudadanos en for- mediata por la cual el documento se ha producido.
mato electrónico Este valor tiene asociado un plazo preestablecido,

17
Software de fuentes abiertas en la Administración electrónica

denominado vigencia administrativa, durante el 2.6. Documentación susceptible de ser


cual el documento genera derechos y obligaciones, archivada
y después del cual el documento perderá ese valor.
Dentro de este apartado, se distinguen los siguien- Las Administraciones Públicas tienen la obligación de
tes valores: conservar los expedientes administrativos mientra no
Valor administrativo: cuya finalidad es dejar expire su periodo de vigencia, durante el cual los do-
constancia de la gestión de un proceso admi- cumentos aportados mantienen un valor probatorio.
nistrativo.
Valor fiscal o contable: valor asociado al cum- Sin embargo, ésta no es la única documentación que
plimiento de obligaciones tributarias o de jus- puede ser objeto de archivado, pudiendo considerar-
tificación de operaciones relacionadas con la se beneficioso la conservación de otros tipos de do-
contabilidad. cumentación que aporten cierto valor informativo o se
Valor legal o jurídico: valor asociado a dere- espere que adquieran un valor histórico en el futuro.
chos u obligaciones legales.
Valor informativo: valor inherente a cualquier A continuación se indica qué tipo de documentación
documento relacionado con sus contenidos. suelen conservar las Administraciones Públicas:
Su finalidad es servir como documentación de Los documentos que forman parte de los ex-
apoyo a la gestión administrativa. pedientes, que materializan actuaciones secuen-
ciales y procedimentales de la Administración en-
Valor secundario: aquel que obedece a otras mo- caminados a la resolución de un asunto, y que se
tivaciones que no son la propia finalidad del docu- deberán clasificar según una serie de normas.
mento, y que se va adquiriendo a lo largo del tiempo: Los libros o recibos de registros para la recepción y
Valor histórico: cuya finalidad es servir como remisión de solicitudes, escritos y comunicaciones.
fuente para la investigación histórica y cultural. La correspondencia o comunicaciones electró-
nicas, que no deben confundirse con los documen-
tos que forman parte de los expedientes.

18
Archivo electrónico de las Administraciones Públicas

La documentación de apoyo a la gestión adminis- Descriptivos: Aportan información sobre aspectos


trativa, como textos legales, boletines oficiales, pu- genéricos del documento como el autor, el título,
blicaciones, folletos comerciales, fotocopias de legis- la fecha de creación, la fecha de publicación, etc.
lación, etc. que ayuden en la gestión de los procesos También pueden proporcionar un breve resumen de
administrativos. los contenidos.
Técnicos: Informan de las características de los so-
portes electrónicos, proporcionando datos sobre
2.7. Metadatos aspectos tecnológicos para el procesado del fiche-
ro. Pueden variar en función de la naturaleza de los
Los metadatos son un concepto básico asociado a la contenidos. A modo de ejemplo se mencionan al-
archivística y pueden definirse como “la información gunos de los más comunes:
referente a la información”. Imágenes: formato empleado, tamaño en píxe-
les de la imagen, mecanismo de compresión,
En la práctica es información complementaria, inde- resolución, esquema de color.
pendiente del documento, que permite categorizarlo y Audio: formato empleado, tasa de compresión,
situar los contenidos dentro de un contexto que facili- duración.
te su comprensión. Texto: fuentes empleadas, características de
presentación
Dado que el Archivo Electrónico persigue la conser- Preservación: Se orientan a garantizar la integri-
vación de la información durante largos periodos de dad y accesibilidad de los contenidos, haciendo re-
tiempo, la capacidad de recuperar el contexto en el ferencia a aspectos como firma de los documentos
que se creó el documento en el futuro es un requisito o pistas de auditoría.
importante.
Los documentos en formato papel almacenan tanto
Existen distintos tipos de metadatos, dependiendo de los contenidos de información como la forma en que
su función informativa: se presentan al usuario. En el mundo digital, los con-

19
Software de fuentes abiertas en la Administración electrónica

tenidos se codifican en ficheros electrónicos como 2.8. Diferencias entre un Gestor


secuencias de unos y ceros, que son procesados por Documental y un Archivo Electrónico
programas y aplicaciones para generar una repre-
sentación de estos contenidos. Distintas interpreta- Otra puntualización importante es establecer la distin-
ciones de las secuencias de unos y ceros darán lugar ción entre los Sistemas de Gestión de Documentos
a representaciones diferentes de los contenidos. Por Electrónicos (SGDE), también llamados Gestores
ello, es tan importante preservar la información como Documentales, y los Sistemas de Gestión de Docu-
documentar las propiedades y características que mentos Electrónicos de Archivo (SGDEA), o Archi-
permitan reconstruir la representación original. vos Electrónicos.

Esta información de representación se registra a tra- Los Gestores Documentales son herramientas que
vés de los metadatos, principalmente de carácter facilitan la creación, edición y compartición de docu-
técnico, y debería estar siempre disponible junto a los mentos electrónicos generados como resultado de la
contenidos del documento. operativa de la unidad organizativa, permitiendo a los
usuarios modificarlos y borrarlos. En otras palabras,
manejan documentos “vivos” que pueden cambiar
como resultado del trabajo diario.

En un Gestor Documental pueden conservarse dis-


tintas versiones de un mismo documento, mantener
duplicados, así como almacenar cualquier documen-
tación de apoyo que se considere oportuno para la
tramitación.

Sólo cuando el documento electrónico alcanza su ver-


sión definitiva y no se permiten nuevas modificacio-

20
Archivo electrónico de las Administraciones Públicas

CARACTERÍSTICAS GESTOR DOCUMENTAL ARCHIVO ELECTRÓNICO


Tipo de documentos Documentos en producción y trámite Documentos de archivo
Modificación de documentos Permitido, pudiendo existir varias versiones de un mismo documento Prohibido, sólo se podrá incluir la versión final del documento
Versiones de documentos Pueden conservarse varias versiones de un mismo documento Sólo se conserva la versión final, que no podrá ser modificada
Eliminación de documentos Permitido Prohibido (excepto en transferencias de un Archivo a otro y
casos excepcionales)
Sistemas de clasificación Opcional (gestionado por los usuarios del sistema) Obligatorio, necesidad de un Cuadro de clasificación, gestionado
y almacenamiento por archiveros
Políticas de conservación Opcionales Obligatorias, teniendo en cuenta que los documentos se
guardan a largo plazo
Objetivo Facilitar la gestión de documentos en el trabajo diario Proporcionar un repositorio seguro para la conservación
de los documentos

nes, se ingresa en el sistema de Archivo Electrónico, Para favorecer su preservación, pueden imponerse al-
que se ocupará de su custodia y conservación. Una gunos requisitos a los documentos previamente a su
vez en el Archivo Electrónico, el documento podrá ingreso en el Archivo Electrónico:
consultarse pero no editarse ni borrarse. formato: será necesario que los documentos elec-
trónicos de archivo tengan unos formatos definidos
El Archivo Electrónico deberá asegurar la accesibili- para su conservación y consulta, recomendándose
dad, disponibilidad, integridad y autenticidad de los que estos formatos estén basados en estándares
documentos electrónicos en el futuro, independiente- abiertos.
mente del medio físico de almacenamiento y del for- firma electrónica: se podrá exigir una serie de
mato del fichero. requisitos a los documentos firmados electrónica-

21
Software de fuentes abiertas en la Administración electrónica

mente para poder verificar su autenticidad e inte- 2.9. Ciclo de vida de los documentos
gridad.
digitalización: los documentos de papel que se Los documentos administrativos evolucionan de
digitalicen, deberán cumplir unos requerimientos acuerdo a un ciclo de vida, que comprende desde que
normativos para que se puedan considerar copias su producción o recepción en las unidades adminis-
auténticas del documento original. trativas hasta su eliminación o conservación por su
valor histórico.
Para facilitar el proceso, se recomienda que las nor-
mas, requisitos y políticas de conservación se se ten- Las fases del ciclo de vida de los documentos son las
gan en consideración desde el mismo instante en el siguientes:
que se genera el documento, y no sólo en el momento Documentación activa: es la etapa en la que los
de su ingreso en el Archivo Electrónico. documentos son producidos o recibidos, su valor
administrativo1 está vigente y su consulta suele ser
El Archivo Electrónico deberá asegurar la accesibili- frecuente.
dad, disponibilidad, integridad y autenticidad de los Documentación semi-activa: es la etapa en la que
documentos electrónicos en el futuro, independiente- el trámite administrativo ha finalizado pero su valor
mente del medio físico de almacenamiento y del for- administrativo se mantiene vigente. Su consulta es
mato del fichero. esporádica.
Documentación inactiva: es la etapa en la que su
valor administrativo ha desaparecido, pero a su vez
el documento ha adquirido un valor secundario, que
puede ser fuente de investigación histórica.

1
El valor administrativo se entiende en este contexto como el valor que tienen los documentos por formar parte de un procedimiento
administrativo, incluidos su valor legal, fiscal contable.

22
03.
Modelo conceptual
del Archivo Electrónico
Archivo electrónico de las Administraciones Públicas

3. Modelo conceptual del Archivo


Electrónico

3.1. Descripción del Modelo Conceptual cretas sobre la conservación de la información a los
distintos órganos de la entidad.
Aunque las tecnologías de almacenamiento actuales
permitirían centralizar toda la información generada en Este modelo es una simplificación del modelo clásico
un sistema único de Archivo Electrónico, se ha optado archivístico estructurado en cuatro niveles de Archivos:
por proponer una estructura jerarquizada de Archivos. Archivo de Gestión o de Oficina
Esta aproximación sigue el modelo archivístico tradi- Archivo Central
cional, adoptado por la mayoría de las Administracio- Archivo Intermedio
nes Públicas para la gestión de sus documentos en Archivo Histórico
formato papel.
Esta organización se ha ido desarrollando para fa-
Esta división se fundamenta en las fases del ciclo de vida cilitar el archivado de grandes cantidades de docu-
de los documentos vistas en el apartado anterior, de mentación en papel, condicionado por la disponibi-
modo que cada tipo de archivo se encargará de la con- lidad de espacio físico en las dependencias de los
servación de documentos con requerimientos similares. Archivos. Con la capacidad de almacenamiento que
dan las tecnologías actuales, esta limitación queda
Los niveles de la estructura se identifican como: superada , por lo que se considera beneficioso sim-
Archivo de Gestión o de Oficina plificar el modelo y agrupar las funciones de Archivo
Archivo Central / Intermedio Central y Archivo Intermedio en un único nivel de la
Archivo Histórico estructura.

Como resultado de esta división, se favorece el esta- Hay que indicar que existen administraciones, como
blecimiento y asignación de responsabilidades con- el Gobierno de Cantabria, que están adoptando esta

25
Software de fuentes abiertas en la Administración electrónica

división clásica para sus sistemas electrónicos de Ar- En el esquema también se establece la relación entre
chivo, siendo igualmente válido a efectos prácticos. el Gestor Documental y el Archivo Electrónico. El
primero será el encargado de la gestión de la docu-
A continuación, se incluye una representación esque- mentación durante el periodo de tramitación, ingre-
Modelo conceptual del mática del modelo, donde se puede ver los tres niveles sando posteriormente las versiones definitivas en el
Archivo Electrónico de las
Administraciones Públicas. de Archivos y las interacciones entre ellos. Archivo Electrónico para su conservación.

Requisitos SGDEA
Digitalización Transferencia (1) Transferencia (2)
Formatos
Firma Electrónica

Archivo Local,
Archivo Central Archivo
de Oficina o de
Gestión documental o Intermedio Histórico
Gestión
corporativa
(SGDE)
Documentación Documentación Documentación
activa semi-activa inactiva

Expedientes
Libros de registro Consulta Consulta
Correspondencia Cuadro de clasificación
Documentación de apoyo a Registro de autoridades
la gestión administrativa (puntos de acceso)

Relación de entrega Expurgo (Junta Calificadora)

26
Archivo electrónico de las Administraciones Públicas

Como se verá posteriormente, se ha contrastado que 3.1.1. Junta Calificadora de documentos


esta división no siempre se establece claramente, administrativos
siendo habitual que el Archivo de Oficina llegue a La Junta/Comisión Calificadora de documentos ad-
estar integrado dentro del propio sistema de Ges- ministrativos de cada órgano se responsabiliza del es-
tión Documental. tudio y dictamen de las cuestiones relativas a la califica-
ción y utilización de los documentos administrativos, así
El traslado de documentación de un archivo a otro vie- como a su integración en los Archivos y al régimen de
ne determinado por unos actos formales denomina- acceso e inutilidad administrativa de tales documentos.
dos transferencias, para los cuales se establece un
procedimiento definido. Las funciones de la Junta/Comisión, cuya composi-
ción, funcionamiento y competencias específicas se
Este evento no tiene porque implicar el movimiento de establecen por vía reglamentaria, incluyen:
información de un sistema a otro, sino que representa Identificación: análisis de la estructura de la orga-
más bien el traspaso de las responsabilidades sobre la nización y de sus funciones, para poder definir las
conservación de esa documentación. series documentales que se producen en cada uno
de los órganos.
En los siguientes apartados se presentan los distintos Valoración: definición de los valores primarios y
niveles del modelo y se explican los mecanismos de secundarios de los documentos electrónicos que
transferencia entre niveles. integran las series.
Consulta: establecerá los criterios de accesibili-
dad y utilización de los documentos y series docu-
mentales.
Transferencia: definición de las características y
requisitos de los documentos y series documen-
tales a transferir de un Archivo a otro, así como los
plazos de permanencia en el Archivo Central.

27
Software de fuentes abiertas en la Administración electrónica

Expurgo: eliminación de los documentos o series Estos usuarios tendrán posibilidad de añadir o consul-
documentales que han superado su periodo de vi- tar documentos según los permisos pertinentes (per-
gencia administrativa y carecen de valor histórico. files de usuario).

3.1.2. Archivo Local, de Gestión o de Oficina Valor de los documentos: informativo, administrati-
Función: Es el Archivo que mantiene la documenta- vo, legal o fiscal (valor primario).
ción mientras dura su tramitación y siempre que su
consulta sea constante. Es decir, se encarga de la Modificación / eliminación: no se podrán modificar
gestión de los documentos en fase activa. o eliminar documentos. Los documentos que forman
parte del Archivo de Oficina deberán ser siempre ver-
Este es el nivel de Archivo más próximo a la unidad siones finales de los documentos generados.
productora y donde los documentos son más fácil-
mente accesibles. Permanencia: Entre 2 y 5 años. Se recomienda no
conservar los documentos electrónicos por un perio-
Responsabilidad: La conservación y la custodia do mayor, ya que raramente se implementan meca-
de los documentos existentes en los Archivos de nismos de preservación a este nivel, siendo preferible
Gestión es responsabilidad de los encargados de transferirlos al Archivo Central.
las unidades organizativas de las que formen parte,
quienes pueden delegar la gestión, clasificación y 3.1.3. Transferencia del Archivo de Gestión al
ordenación de los documentos en uno o más res- Archivo Central
ponsables. Se llama transferencia al proceso archivístico por el
que, trascurrido el periodo de permanencia en las uni-
Acceso: Se podrá acceder por distintos medios, dades productoras, se traspasan las series documen-
siendo necesario siempre la identificación del usua- tales al Archivo de nivel superior. Implica el traspaso
rio. Se establecerán perfiles de usuario, dependiendo de las responsabilidades sobre el tratamiento y custo-
del grado de acceso a los documentos requeridos. dia de dicha documentación.

28
Archivo electrónico de las Administraciones Públicas

Una serie documental es el conjunto de los docu- Son candidatos al traslado al Archivo Central todos aque-
mentos, producidos o gestionados por una unidad llos expedientes administrativos cuya tramitación a con-
orgánica en cumplimiento de sus funciones, y que tie- cluido, así como cualquier otro tipo de documentación
nen el mismo tipo documental o se refieren a un mismo para la que se determine que su consulta no es habitual.
asunto. Las series documentales suelen ser archiva-
das, conservadas, utilizadas, valoradas, transferidas Los documentos se clasificarán de acuerdo a un Cua-
o eliminadas como una única unidad. dro de Clasificación, esquema donde se encuentran

Transferencia el Archivo de
Gestión al Archivo Central.

Transferencia (1) Transferencia (2)

Gestión documental Archivo Local,


Archivo Central Archivo
corporativa de Oficina o de
o Intermedio Histórico
(SGDE) Gestión

29
Software de fuentes abiertas en la Administración electrónica

estructuradas de forma jerárquica y lógica las series 3.1.4. Archivo Central o Intermedio
documentales que conforman las secciones de un Función: Es el Archivo que reúne la documentación
Fondo Documental (conjunto de documentos reco- que se debe conservar por un periodo de tiempo
nocido dentro de los Archivos). definido, debido a obligaciones administrativas, le-
gales o fiscales, pero que se consulta rara vez. Es
Sólo se transferirán los documentos cuyo valor sea decir, se encarga de la gestión de la documentación
administrativo, legal o fiscal, eliminándose previa- semi-activa.
mente cualquier copia o duplicado, así como de la do-
cumentación de apoyo a la gestión administrativa. Responsabilidad: Unidad de Archivo dentro del órga-
no administrativo, el cual se encarga de la conserva-
Responsable de la transferencia: Jefe de la Unidad, ción y custodia de los documentos.
quién debe firmar electrónicamente la relación de en-
trega de los documentos a transferir. Acceso: La consulta de los documentos archivados
requerirá la solicitud a la Unidad de Archivo, quienes
Esta Relación de Entrega es un documento en el que deberán autorizar al solicitante. La Junta/Comisión
se detallan: Calificadora de documentos administrativos fijará una
listado de documentos que se van a transferir serie de normas para el acceso a los documentos den-
persona encargada de realizar la transferencia tro del Archivo Central.
serie documental y expediente al que pertenecen
los documentos, Dependiendo del tipo de documento requerido, se po-
periodo de vigencia administrativa drán habilitar distintos medios, no siendo posible en
ningún caso la alteración del documento.
Receptor de la transferencia: será la persona encar-
gada del Archivo Central, que deberá verificar la docu- Para añadir nuevos documentos a un expediente, en
mentación entregada y validar si es correcta y se co- circunstancias muy excepcionales, será necesario
rresponde con lo indicado en la relación de entrega. autorización del responsable de la Unidad de Archivo.

30
Archivo electrónico de las Administraciones Públicas

Transferencia el Archivo de
Gestión al Archivo Histórico.

Transferencia (1) Transferencia (2)

Gestión documental Archivo Local,


Archivo Central Archivo
corporativa de Oficina o de
o Intermedio Histórico
(SGDE) Gestión

Valor de los documentos: administrativo, legal o fiscal Como excepción, aquellos documentos con interés
(valor primario). histórico o que puedan ser objeto de investigación
científica, se transferirán al Archivo Histórico donde se
3.1.5. Transferencia del Archivo Central al conservarán permanentemente.
Archivo Histórico
Cuando la vigencia administrativa de un documento En este paso, la Junta/Comisión Calificadora de do-
o serie documental haya finalizado, se procederá a su cumentos administrativos realizará un expurgo, que
eliminación del Archivo. es el proceso de evaluación crítica de documentación

31
Software de fuentes abiertas en la Administración electrónica

con vistas a su posterior conservación o eliminación, 3.1.6. Archivo Histórico


en función de la existencia de valor histórico. Este pro- Función: Reúne los expedientes y documentos que
ceso tendrá como resultado: deben conservarse indefinidamente por su valor his-
tórico. Se asocia a la última fase del ciclo de vida de los
Eliminación de los documentos o series documen- documentos, cuando la documentación se considera
tales cuya vigencia administrativa haya finalizado y inactiva.
carezcan de un valor documental.
Conservación y transferencia al Archivo Histórico Responsabilidad: Unidad de Archivo Histórico, la
de los documentos que hayan adquirido un valor cual se encargará de su gestión y conservación.
histórico a lo largo de su ciclo de vida.
Acceso: mediante solicitud a la Unidad de Archivo
Responsable de la transferencia: Junta/Comisión Histórico, quién deberá autorizar al solicitante.
Calificadora de documentos administrativos, que será
la encargada de decidir los documentos que se de- Valor de los documentos: histórico, debido a que ha
ben transferir al Archivo Histórico y los que se deben finalizado la vigencia administrativa de los documen-
eliminar. tos, perdiendo su valor primario (administrativo, fiscal
o legal).
Receptor de la transferencia: Unidad de Archivo
Histórico, encargado de los documentos históricos.

32
Archivo electrónico de las Administraciones Públicas

3.2. Aspectos clave del modelo ceso de transformación en el que pueden perderse
algunas de las características de presentación del
A continuación se presentan la aproximación hecha a formato original.
algunos de los aspectos más determinantes del Archi- Emulación: Es la construcción de aplicaciones ba-
vo Electrónico en el ámbito de la Administración Pú- sadas en la tecnología del momento para que sean
blica. capaces de manejar el formato original y mostrar
una representación de sus contenidos.
Son los temas que han generado un mayor interés du- Mantenimiento de la infraestructura original: Su-
rante las entrevistas de contraste, en las cuales se han pone conservar los sistemas, tanto hardware como
generado interesantes aportaciones que han permiti- software, existentes en el momento de creación del
do centrar y completar el estudio inicial. documento. Es una solución compleja y costosa ya
que implica el mantenimiento de múltiples platafor-
3.2.1. Políticas de conservación de los contenidos mas.
La mayor dificultad que se presenta al abordar el Ar-
chivo Electrónico es cómo mantener los contenidos Durante el contraste del modelo se ha verificado que
accesibles para los usuarios durante largos periodos la migración de formato es la alternativa preferida por
de tiempo, evitando que los soportes queden obso- la mayoría de las Administraciones Públicas consulta-
letos. das, pudiendo complementarse con la implantación
de emuladores en algunos casos.
La manera de solventar este problema es planificando
y poniendo en práctica políticas de preservación de Hay que destacar que, para acometer políticas de mi-
los documentos almacenados en el Archivo Electró- gración y especialmente de emulación, es necesario
nico. Esta tarea se aborda a través de las siguientes conocer las especificaciones técnicas de los formatos
aproximaciones: empleados, por lo existe coincidencia en considerar el
Migración: Implica una conversión del documento uso de formatos basados en estándares libres como
a un formato más actual, por lo que implica un pro- un requisito fundamental.

33
Software de fuentes abiertas en la Administración electrónica

3.2.2. Formatos de fichero admitidos por el 3.2.3. Preservación de documentos firmados


Archivo electrónicamente
Con objeto de homogenizar la gestión de los conteni- El valor legal de los documentos archivados debe
dos archivados, la mayoría de las entidades entrevis- mantenerse durante todo el tiempo que establece
tadas coinciden en la necesidad de restringir los tipos la legislación, para lo cual deberá garantizarse la au-
de formatos admitidos por el Archivo a un conjunto tenticidad e integridad del documento. Eso se rea-
predeterminado y consensuado con los productores. liza en el escenario digital a través de la firma elec-
trónica.
Esta aproximación permitiría centralizar los recursos
disponibles en el desarrollo de políticas de migración Establecer la validez de estas firmas durante perio-
y emulación únicamente para un número reducido de dos prolongados de tiempo es uno de los aspectos a
formatos distintos, favoreciendo su implantación y garantizar por el Archivo Electrónico, ya que, debido
reutilización. a la caducidad de los certificados digitales usados
para la firma, no es posible asegurar su accesibili-
Estos formatos deberán presentar unas caracterís- dad en el futuro.
ticas apropiadas que favorezcan la preservación de
los documentos durante largos periodo de tiempo y En este sentido, una solución consistiría en recopi-
su presentación en diversas aplicaciones y entornos lar, junto con la firma digital, todos los datos necesa-
tecnológicos. rios para su validación y registrarlos en el repositorio
Como norma general, se favorecerá la adopción de junto con el documento firmado. Entre los datos a
formatos basados en estándares abiertos y recono- preservar se indicarían el mecanismo de firma usa-
cidos. En todo caso, se podrían aceptar formatos do, cadenas de certificados que prueben la validez
propietarios siempre que sus especificaciones sean de la CA, listas de revocación, etc.
públicas.
Esta información deberá estar disponible en el mo-
mento del ingreso en el Archivo. Así el sistema será

34
Archivo electrónico de las Administraciones Públicas

capaz de validar la autenticidad del documento en 3.2.4. Clasificación de la documentación


ese momento y “dar fe” de la misma a través de una Los volúmenes cada día mayores de información ar-
sello temporal electrónico. chivada hacen necesario la adopción de mecanismos
de clasificación desde el mismo momento de gene-
Esta aproximación se ha contrastado como adecua- ración de los documentos electrónicos como la única
da por la práctica totalidad de las Administraciones manera de catalogarlos y facilitar mecanismos para su
Públicas entrevistadas. consulta en el futuro.

La firma electrónica garantiza el contenido del fiche- Para ello deberá favorecerse la adopción de criterios
ro original, pero no es extensible a cambios futuros archivísticos en la gestión de la documentación, así
en el fichero, por ejemplo producto de una migración como la participación del colectivo de archiveros de
de formato. Surge por tanto el problema de cómo las organizaciones en los procesos de diseño e im-
garantizar que la nueva versión es una representa- plantación del Archivo Electrónico.
ción veraz del documento firmado.
Uno de los mecanismos principales para facilitar esta
La recomendación en este caso es mantener tanto el clasificación es la incorporación de metadatos a la
fichero original como la nueva versión en el archivo, gestión de la documentación.
documentando el proceso realizado. Sobre estos
datos se realizará un nuevo sello temporal como ga- 3.2.5. Aplicación del concepto de expediente
rantía de la preservación de los contenidos. electrónico
La mayoría de las aproximaciones al Archivo Elec-
Estos sellos temporales tienen también validez por trónico usan el documento como unidad de ges-
tiempo limitado, debido a la caducidad de los cer- tión. Sin embargo, la tramitación administrativa
tificados digitales empleados. Por ello deberán es- actualmente se fundamenta en el concepto de
tablecerse políticas de resellado que garanticen la expediente administrativo, el cual agrupa diversos
autenticidad a lo largo del tiempo de archivado. documentos.

35
Software de fuentes abiertas en la Administración electrónica

En este sentido, la representación que da la LAECSP 3.2.6. Soporte para la documentación en


del Expediente Electrónico, como un índice electró- formato papel
nico firmado por la Administración que referencie los El modelo de Archivo propuesto, aunque se orienta
documentos electrónicos que lo componen, permite fundamentalmente a la gestión de documentos en for-
superar esta diferencia y adecuarse a las soluciones mato electrónico, proporciona ciertas facilidades para
implementadas por las Administraciones entrevista- la gestión de documentación en papel.
das.
Como es obvio, los contenidos de un documento en
Se considera necesario que, independientemente de papel no pueden incorporarse al Archivo Electrónico.
las soluciones implantadas, se adopte esta interpreta- Sin embargo, lo que sí puede incluirse en el Archivo
ción, para lo cual deberá habilitarse mecanismos para es una reseña electrónica que describa la naturaleza
el establecimiento de relaciones y referencias entre los y procedencia del documento así como su ubicación
documentos archivados. física. Esta reseña electrónica puede incorporarse al
expediente electrónico, que recopilará un listado con
Por otro lado, la LAECSP permite que un mismo do- la totalidad de documentos que lo forman, indepen-
cumento forme parte de distintos expedientes. Esto dientemente de su formato de origen.
plantea problemas derivados de los distintos tiempos
de vigencia de los documentos y puede ocasionar El Archivo Electrónico se convierte así en un medio de cen-
que expedientes caducados deban ser preservados tralizar las consultas de los usuarios, que no necesitarán
porque contienen información referenciada por otros conocer el soporte en que se generó el documento. En caso
expedientes aún vigentes. de requerir un documento en formato electrónico, el usuario
podrá acceder a su contenido, mientras que si está en for-
En este sentido, habrá que validar cada expediente mato papel, recibirá la información sobre dónde solicitarlo.
previamente a su eliminación, asegurando la conser-
vación de aquellos documentos que formen parte de De todos modos, la tendencia actual se encamina a la
otros expedientes activos. homogenización de los soportes a través de procesos

36
Archivo electrónico de las Administraciones Públicas

de digitalización de la documentación en papel. Así, ternativos para realizar esta consultas (solicitud
los documentos se escanean y se firman electrónica- expresa a la unidad productora, procesos de auto-
mente para dar prueba de su autenticidad e integridad, rización).
lo que permite incorporarlos al Archivo Electrónico.
3.2.8. Organización
3.2.7. Seguridad de la información Se ha detectado que existen organizaciones, princi-
Dado que el contenido de los expedientes administra- palmente en el ámbito local, que no han establecido
tivo puede contener información personal y/o confi- aún procedimientos adecuados para el archivo de la
dencial, es necesario establecer el alto nivel de control documentación en formato electrónico. Esto lleva a la
tanto sobre los resultados devueltos por las consultas falta de una definición formal sobre la responsabilidad
al sistema como sobre el acceso a los propios docu- sobre la conservación de los documentos a lo largo de
mentos. su ciclo de vida.

Así, debería garantizarse que la información confiden- En esta situación, se favorece que las unidades pro-
cial sólo sea presentada a: ductoras conserven la información durante largos pe-
Los funcionarios con competencias atribuidas so- riodo de tiempo, limitando la visibilidad de la misma
bre la materia que trata el expediente. para otras partes de la organización.
Los propios usuarios interesados en el procedi-
miento. Además, mucha de esta información no llega a archi-
varse nunca, manteniéndose localmente en los pues-
En este aspecto, la normativa de referencia es la LOPD, tos de los usuarios, con pocas garantías de conser-
por lo que el sistema tendrá que ser auditado para verificar varse y se accesible a medio plazo.
que cumple con los parámetros establecidos en la Ley.
En este contexto, implantar políticas de seguridad efi-
En cualquier caso, se considera menos perjudicial caces que abarquen todo el ciclo de vida de los docu-
restringir el acceso e implementar mecanismos al- mentos es costoso y de difícil mantenimiento.

37
Software de fuentes abiertas en la Administración electrónica

La centralización de la información dentro de la unidad Regulación de los formatos de archivo requeridos a


administrativa facilitaría la asignación de responsabili- los ciudadanos y en las comunicaciones entre Ad-
dades sobre su conservación, así como la homogeniza- ministraciones.
ción de su gestión por parte de los distintos usuarios. Definición de procedimientos para la transferencia
de ficheros digitales entre los distintos tipos de fi-
Para ello, será necesario promover buenas prácticas chero.
relacionadas con la gestión de la documentación, Regulación de procedimientos para la consulta y
como: acceso a la información.
Establecimiento de criterios comunes para el eti- Definición de criterios de validez que rijan los proce-
quetado y catalogación de los documentos sos de transformación de ficheros digitales, espe-
Definición de procedimientos de generación, edi- cialmente de aquellos firmados electrónicamente.
ción y revisión de la documentación dentro de la
organización. Esta indefinición está provocando el retraso en la implan-
tación de medidas concretas por parte de las Administra-
3.2.9. Entorno normativo ciones Públicas y, como consecuencia, muchas de ellas
Durante las entrevistas realizadas, las Administracio- están optando por adoptar criterios “de contingencia” de
nes encuestadas han manifestado su preocupación manera particular, soportados por normativa particular.
relativa a la existencia de un vacío normativo que regu-
le la gestión adecuada de la documentación electróni- En este sentido, se espera con interés la aprobación
ca, principalmente en aspectos como: de nueva regulación de ámbito nacional que clarifique
algunos de estos aspectos anteriores, en concreto:
Definición de plazos de conservación de la docu- Reglamento de aplicación de la Ley 11/2007, de
mentación en cada uno de los tipos de archivo. Acceso Electrónico de los Ciudadanos a los Servi-
Estandarización de metadatos como medio de fa- cios Públicos (LAECSP).
vorecer la interoperabilidad entre organismos pú- Esquema Nacional de Interoperabilidad.
blicos. Esquema Nacional de Seguridad.

38
04.
Aplicación del modelo conceptual
a las Administraciones Públicas
Archivo electrónico de las Administraciones Públicas

4. Aplicación del modelo conceptual


a las AAPP

4.1. Flexibilidad del modelo de Archivo 4.2. Escenario 1


Electrónico propuesto
Este escenario se produce en unidades administrati-
La división del modelo en diferentes niveles de Archi- vas con un volumen reducido de documentación a
vo facilita la asignación de responsabilidades sobre gestionar y que, hasta la fecha, no han tenido la nece-
la conservación del documento en función del punto sidad de implantar un sistema informático de Gestión
de su ciclo de vida en que se encuentre. Documental.

Este modelo intenta dar respuesta a la problemática En este contexto, la información habitualmente se
desde una perspectiva organizativa, tratando en lo encuentra descentralizada, diseminada en distintos
posible de independizarlo del entorno tecnológico sistemas informáticos, y no existen los mecanismos
existente en cada organismo y dotándolo de sufi- necesarios para garantizar su seguridad e integridad.
ciente flexibilidad para que pueda ser adaptado a los
requerimientos de los distintos tipos de Administra- En este escenario, la consulta de información suele ser
ciones Públicas. ineficaz y el riesgo de pérdida de información muy alto.

En este sentido, durante las reuniones de contraste, La implantación de un sistema de Archivo Electrónico
se han identificado dos escenarios particulares, de- proporciona un repositorio único en la unidad organizativa
terminados por la infraestructura tecnológica exis- donde almacenar la información a conservar, lo que per-
tente en la organización, y que podría pensarse que mite centralizar las consultas tanto internas como exter-
quedan fuera del modelo propuesto, aunque como nas. Así mismo, facilita la implantación de procedimientos
se verá a continuación no es así. de control de accesos y salvaguarda de la información.

41
Software de fuentes abiertas en la Administración electrónica

Como puede comprobarse en el esquema siguiente, Este escenario tiende a darse en Entidades Locales
el modelo sigue siendo válido implantando mecanis- de tamaño reducido con una baja implantación de la
mos que permitan el ingreso de los documentos en el Administración Electrónica.
Adaptación del Modelo de
Archivo al Escenario 1. sistema de Archivo por parte de los usuarios.

Requisitos SGDEA
Digitalización Transferencia (1) Transferencia (2)
Formatos
Firma Electrónica

Archivo Local,
Archivo Central Archivo
de Oficina o de
Interfaz de usuario o Intermedio Histórico
Gestión
para ingreso en archivo

Documentación Documentación Documentación


activa semi-activa inactiva

Expedientes
Libros de registro Consulta Consulta
Correspondencia Cuadro de clasificación
Documentación de apoyo a Registro de autoridades
la gestión administrativa (puntos de acceso)

Relación de entrega Expurgo (Junta Calificadora)

42
Archivo electrónico de las Administraciones Públicas

4.3. Escenario 2 ponsabilidad sobre la preservación de la información


electrónica que generan durante periodos de tiempo
Esta situación se corresponde con unidades admi- extensos, ya que no disponen de un Archivo Central
Adaptación del Modelo de
nistrativas que actualmente están asumiendo la res- corporativo donde derivar sus fondos documentales. Archivo al Escenario 2.

SGDEA
Transferencia (1)* Transferencia (2)

Requisitos

Módulo de Archivo Central Archivo


Archivo o Intermedio Histórico
Gestión documental
corporativa (SGDE)
Document. Documentación
activa Documentación
semi-activa inactiva

Expedientes Consulta Consulta


Libros de registro Cuadro de clasificación
Correspondencia Registro de autoridades
Documentación de apoyo a (puntos de acceso)
la gestión administrativa
Relación de entrega Expurgo (Junta Calificadora)

* Los ficheros a trasferir deberán cumplir los criterios de fomato,


firma, etc impuestos por el Archivo Central.

43
Software de fuentes abiertas en la Administración electrónica

Este tipo de organizaciones tienden a implementar 4.4. Normas internacionales


Gestores Documentales complejos, que imple-
mentan funcionalidad adicional para el archivo y pre- A continuación se muestra una relación de normas y mo-
servación de documentos electrónicos. En la prácti- delos desarrollados para facilitar el diseño y gestión de
ca se puede ver como que el Archivo de Gestión se sistemas de Archivo y sistemas de Gestión Documental.
ha integrado dentro del propio Gestor Documental.
Dado que la responsabilidad de la gestión sigue asig- Ninguna de ellas es de obligado cumplimiento y su
nándose a la unidad administrativa, la no existencia propósito es establecer recomendaciones para el de-
de sistemas separados para Gestión Documental y sarrollo y gestión de sistemas que trabajen con docu-
Archivo Electrónico, no invalida el modelo propuesto. mentos electrónicos.
En estos casos es importante identificar el organismo
que debe realizar las funciones de Archivo Central o 4.4.1. MoReq2 - Model Requirements for the
Intermedio (como el Archivo General de la Administra- management of electronic records
ción para la AGE) y establecer los procedimientos para Esta especificación describe un Modelo de Requisitos
la transferencia de documentación (formatos, criterios funcionales para la gestión de documentos electróni-
de validación, etc.) con el mismo. cos de archivo, destinados a facilitar el diseño y la eva-
luación de un SGDEA.
Esta aproximación se está adoptando en distintas Ad-
ministraciones Autonómicas (como Gobierno de Ara- 4.4.2. ISAAR (CPF) - International Standard
gón y Junta de Extremadura) y en organismos depen- Archival Authority Records for Corporate
dientes de la AGE, como la Agencia Tributaria. Bodies, Persons and Families
Esta norma sirve de guía para elaborar registros de
autoridad de archivos que proporcionan descrip-
ciones de entidades (instituciones, personas y fa-
milias) asociadas a la producción y a la gestión de
archivos.

44
Archivo electrónico de las Administraciones Públicas

4.4.3. ISAD (G) - General International Standard 4.4.5. ISO 14721:2003 - Open archival
Archival Description information system (OAIS)
Esta norma constituye una guía general para la elabo- Norma que precisa un modelo de referencia para siste-
ración de descripciones archivísticas, identificando mas de infomación de archivo, ya sean físicos o electró-
y explicando el contexto y el contenido de los docu- nicos, estableciendo un esquema de organización con
mentos de archivo con el fin de hacerlos accesibles, e responsabilidades concretas en la preservación de la
integrando esta información contextual, definida en la información y facilitando su acceso a una determinada
norma complementaria ISAAR (CPF) y en las normas comunidad de usuarios.
nacionales existentes.
4.4.6. UNE-ISO 15489-1 - Información
4.4.4. NEDA - Normas Españolas de y documentación - Gestión de
Descripción Archivística documentos - Parte 1: Generalidades
Normas profesionales desarrolladas por CNEDA Esta parte de la Norma ISO 15489 regula la gestión de
(Comisión de Normas Españolas de Descripción Ar- documentos, en todos los formatos o soportes, que
chivística, creada por Orden del Ministerio de Cultu- producen o reciben las organizaciones, ya sean públi-
ra de 25 de mayo de 2007 (Orden CUL/1524/2007)), cas o privadas, en el ejercicio de sus actividades.
y orientadas a favorecer la realización de una prác-
ticas adecuadas y homogéneas en los procesos 4.4.7. UNE-ISO/TR 15489-2 - Información y
técnicos de identificación y descripción de fondos/ documentación – Gestión de documentos
colecciones de archivo, así como en la introducción - Parte 2: Directrices
y salida de datos en los SGDEA, facilitando la bús- Esta parte de la Norma ISO 15489 es una guía de im-
queda y localización de los recursos archivísticos plementación de la Parte 1 para su uso por parte de los
y el intercambio/comunicación de la información profesionales de la gestión de documentos, propor-
descriptiva. cionando una visión general de los procesos y facto-
res que se deben tener en cuenta en el cumplimiento
de la Norma.

45
05.
Definición funcional
del Archivo Electrónico
Archivo electrónico de las Administraciones Públicas

5. Definición funcional del Archivo


Electrónico

5.1. El modelo OAIS temas. Para cada uno de estos módulos se definen
unos requisitos funcionales así como la forma en que
OAIS (Open Archive Information System) es un mo- interactúan con otros módulos.
delo de referencia para la implantación de un sistema
de repositorio digital desarrollado por el Consultative A continuación se describen los distintos módulos de
Committee for Space Data Systems (CCSDS) y estan- una manera muy concisa. En apartados posteriores se
darizado a través de la ISO 14721:2003. ampliará el propósito de cada uno de ellos.

Este modelo se ha concebido como un marco de re- 5.1.1. Módulo de ingreso (Ingest)
ferencia frente al que evaluar los sistemas de preser- Habilita los procesos para la admisión de los objetos
vación de la información digital. Su orientación hacía digitales procedentes de los productores.
la preservación a largo plazo lo distingue de otros mo-
delos y, en la actualidad, es la referencia a la hora de 5.1.2. Módulo de almacenamiento (Storage)
abordar el diseño de un sistemas para el archivo pro- Establece mecanismos para la conservación de los
longado de información digital. objetos digitales en el repositorio.

OAIS no especifica una implantación tecnológica del 5.1.3 . Módulo de gestión de datos (Data
modelo, ni menciona sistemas o tecnologías particu- management)
lares. Mantiene y gestiona un registro de metadatos des-
criptivos de los objetos digitales almacenados.
El modelo divide el sistema de Archivo Electrónico en
un conjunto de módulos funcionales que abarcan el
conjunto de servicios provistos por este tipo de sis-

49
Software de fuentes abiertas en la Administración electrónica

5.1.4. Módulo de consulta y recuperación 5.1.6. Módulo de preservación (Preservation


(Access) Planning)
Proporciona servicios a los usuarios para la realiza- Monitoriza y hace un seguimiento de la evolución tec-
ción de búsquedas en el repositorio y la visualización y nológica para definir políticas de conservación de la
obtención de copias de la información. información almacenada.

5.1.5. Módulo de administración y


configuración (Administration)
Facilita la gestión operativa del sistema.
Esquema del Modelo OAIS.

Preservación

Información descriptiva
Información descriptiva
Gestión de datos Consultas
Resultados Consultas
Productor Ingreso Consulta
Peticiones Usuario
SIP
Almacén
AIP DIP
AIP

Administración y configuración

Administrador

50
Archivo electrónico de las Administraciones Públicas

5.2. Adecuación del modelo OAIS Se ha considera adecuado que, a la hora de definir
El modelo OAIS ha servido de referencia a la hora de las transferencias, el Archivo origen entregue la docu-
definir la funcionalidad del modelo propuesto de Ar- mentación en un encapsulamiento adecuado para su
chivo Electrónico de las Administraciones Públicas. ingreso en el Archivo destino, evitando la necesidad
de una transformación intermedia de los datos.
Sin embargo, no hay que olvidar que OAIS aborda el
diseño de repositorios digitales genéricos, por lo que Si esto no fuese así, debería contemplarse la participa-
ha sido necesario ampliar la definición funcional inclu- ción de este módulo en el proceso de transferencias.
yendo modificaciones para adecuarlo a los requeri-
mientos propios de las Administraciones Públicas. 5.2.2. Módulo de Gestión de Transferencias
El modelo OAIS considera el repositorio digital como
5.2.1. Módulo de Pre-ingreso un sistema único. Sin embargo el modelo propuesto
Éste no es un módulo dentro del sistema de Archivo establece una estructura jerárquica por niveles que se
Electrónico, sino un complemento al modelo que ac- implementará sobre distintos sistemas.
túa como interfaz para facilitar la entrada de datos.
Para facilitar el traspaso de información entre los distintos
Este módulo, como se detallará más adelante en el docu- Archivos que componen esta jerarquía, se ha extendido
mento, permite estructurar los contenidos a almacenar jun- el modelo definido por OAIS con un nuevo módulo que
to con la información de contexto (metadatos) proporciona- agrupará la funcionalidad relativa a la propuesta de trans-
da por el proveedor dentro de un encapsulamiento único, ferencias de documentación, su aceptación por parte del
facilitando el proceso de ingreso en el Archivo Electrónico. Archivo destino y la transferencia de la información.

En principio, este módulo sólo se considera sólo para la Hay que destacar que esta funcionalidad podría haberse
implantación del Archivo Local, como un modo de facilitar incorporado a otros módulos existentes en OAIS, pero
la comunicación entre los sistemas productores (sistemas se ha considerado que tiene una importancia suficiente
de Gestión Documental) y el Archivo Electrónico. como para poder se tratada independientemente.

51
Software de fuentes abiertas en la Administración electrónica

5.2.3. Modelo funcional propuesto


Modelo funcional de un sistema de Archivo Electrónico.

Modelo funcional de un sistema de Archivo Electrónico

Sistema de Módulo
información de de Firma
organismos Electrónica

Productor

Conservación Transferencias

Gestión de datos

Pre-ingreso Ingreso Almacenamiento Consulta y acceso


Usuarios

Configuración y administración

Archivo físico Archivo Electrónico

52
Archivo electrónico de las Administraciones Públicas

Hay que destacar que este esquema funcional se corresponde con la implantación únicamente de uno de los Ar-
chivos que componen la estructura jerárquica (Archivo de Oficina, Archivo Central / Intermedio, Archivo Histórico).
El siguiente gráfico ofrece una visión de conjunto del modelo.

Relación del Modelo Conceptual con el Modelo Funcional.

Archivo Local,
Archivo Central Archivo
de Oficina o de
o Intermedio Histórico
Gestión

53
06.
Implementación tecnológica
del Modelo Conceptual
Archivo electrónico de las Administraciones Públicas

6. Implementación tecnológica
del Modelo Conceptual

6.1. Alcance de la implementación Por ello, durante el diseño, se ha optado por primar la
adopción de estándares y modelos reconocidos so-
Una vez definido el Modelo Conceptual, los trabajos bre la implantación de aplicaciones concretas. De este
abordados se han dirigido a determinar la viabilidad modo, se persigue dotar al diseño de una mayor flexi-
técnica de una implantación real empleando única- bilidad y favorecer una mayor independencia respecto
mente componentes de software de fuentes libres. a tecnologías y proveedores concretos, facilitando la
generación de otros diseños a partir de componentes
Así, se ha realizado un análisis del mercado orientado alternativos.
a comprobar la existencia de soluciones open-source
consolidadas, que proporcionasen las funcionalida-
des requeridas en el modelo propuesto y contrastado 6.2. Contexto tecnológico
con las Administraciones Públicas.
A diferencia de otros componentes de la Adminis-
Como resultado, se ha generado un inventario de com- tración Electrónica, como el Registro Electrónico o
ponentes comerciales, en base al cual se ha elaborado la firma digital, el Archivo Electrónico es un campo
el diseño de un posible piloto de Archivo Electrónico. donde se han hecho pocos avances. Así, en la ac-
tualidad, apenas existen aplicaciones producti-
Es importante indicar que este diseño no debe verse vas de Archivo orientadas a la tramitación admi-
como una propuesta cerrada, sino como una vali- nistrativa.
dación teórica de que realmente es factible acometer
la construcción de un Archivo Electrónico plenamente Como ejemplos cabe mencionar:
operativo basado exclusivamente en software open- @rchivA, impulsada por la Junta de Andalucía.
source. SIGEM, impulsada por el MITyC.

57
Software de fuentes abiertas en la Administración electrónica

En general, estos productos implementan mecanis- dos para considerar su adopción en el entorno de la
mos derivados del archivo tradicional, basado en so- Administración Pública.
portes en papel, adaptados para el almacenamiento
de ficheros electrónicos. Hay que tener en cuenta que las diferencias entre
estos dos ámbitos, impuestas principalmente por el
Esta aproximación, aunque puede solventar la proble- marco normativo, van a suponer que estas herramien-
mática actual, no proporciona la suficiente flexibilidad tas no incorporen toda la funcionalidad requerida por
y capacidad de expansión que el nuevo escenario vin- la Administración, por lo que se hará necesario com-
culado a la Administración Electrónica necesitará en plementarlos con otros componentes que amplíen su
los próximos años. funcionalidad para producir una solución de archivo
consistente y adecuada a la legalidad vigente.
Sin embargo, a diferencia de en el sector público, el
uso de repositorios de archivos digitales sí está muy
extendido en el ámbito académico y científico, dónde 6.3. Soluciones de repositorio existentes
se utilizan habitualmente para la publicación y com- basadas en software open-source
partición on-line de documentación técnica.
Como parte del trabajo acometido se han seleccio-
Muchas de estas aplicaciones, impulsadas principal- nado y analizado diversas aplicaciones de repositorio
mente desde universidades, han sido liberadas como digital basadas en software de fuentes abiertas. Estos
software de fuentes abiertas, lo que ha favorecido la for- repositorios se orientan a la conservación de cualquier
mación de comunidades activas de usuarios que colabo- tipo de documento y a su publicación a una comuni-
ran para mejorarlas y desarrollar nuevas funcionalidades. dad de usuarios.

Gracias a este trabajo, estos sistemas han evoluciona- Dado que el objetivo es la conservación de documen-
do enormemente durante la última década, y pueden tos en su versión definitiva, el estudio se ha centrado
considerarse suficientemente maduros y evoluciona- en productos orientados a la preservación de la infor-

58
Archivo electrónico de las Administraciones Públicas

mación y a facilitar su búsqueda y consulta por parte tuciones. Gracias a ello, existe una gran cantidad de
de distintos usuarios. De este modo, se han primado experiencias documentadas que permiten contrastar
aplicaciones que: su rendimiento y funcionalidad.
Permitan la incorporación de metadatos para clasi-
ficar y contextualizar los contenidos archivados.
Implementen mecanismos de búsqueda eficaces
sobre la información archivada.
Dispongan de un modelo de datos que agrupe con-
tenidos y metadatos como una única entidad.
Faciliten la presentación de la información a los
usuarios, evitando su modificación.
Posibiliten la implantación de mecanismos de pre- Hay que indicar que existen otros repositorios con
servación y actualización de la información. funcionalidad similar pero con una difusión mucho
menor, por lo que se consideran productos minorita-
Hay que indicar que aunque en la actualidad se están rios y menos adecuados.
empleado soluciones de Gestión Documental para el
archivo de documentos electrónicos, se ha optado Junto con las cuatro aplicaciones anteriores, se ha
por centrar el estudio en aquellas diseñadas específi- estudiado la validez de tres herramientas comerciales
camente como repositorio. cuyo código fuente ha sido liberado por las empresas
desarrolladoras.
En concreto, se han seleccionado las cuatro aplica-
ciones open-source de repositorio predominantes a
nivel mundial. Estas aplicaciones, impulsadas a través
de diversas universidades y centros de investigación,
cuentan con una amplia aceptación y han sido implan-
tadas en numerosos organismos, empresas e insti-

59
Software de fuentes abiertas en la Administración electrónica

A posteriori, el estudio se ha completado con dos solu- Los usuarios del sistema podrán:
ciones más (iArxiu y Alfresco) identificadas durante las re- Realizar consultas en función de ciertos crite-
uniones de contraste con las Administraciones Públicas. rios y generar listados de resultados.
Recuperar una copia del objeto digital para su
A partir de este estudio comparativo, se han identificado visualización.
qué soluciones ofrecen mejores condiciones para con- Finalmente un administrador del sistema podrá:
formar el núcleo funcional del diseño del piloto, valoran- Añadir, modificar y eliminar metadatos asocia-
do, entre otros, los siguientes aspectos: dos a un objeto digital.
Funcionalidad proporcionada y necesidad de incor- Establecer permisos de acceso a los objetos
porar componentes complementarios. digitales archivados.
Capacidad de integración con otros sistemas. Generar informes de operación del sistema.
Facilidad para el desarrollo de nuevas funcionalida-
des. 6.3.1. DSpace
Existencia de comunidades establecidas. Es una herramienta desarrollada por el Instituto Tec-
Documentación y soporte técnico disponible. nológico de Massachusetts (MIT), en colaboración
Experiencias de implantaciones previas. con HP, para la implantación de su propia librería di-
gital. La primera versión del código fue liberada en
Hay que destacar que, aunque sólo DSpace, Fedora 2002.
Commons y ePrints cumplen con el modelo OAIS, todas
las herramientas proporcionan, en mayor o menor medi- Ha sido ampliamente adoptado por distintos or-
da, la funcionalidad básica requerida por este modelo, ganismos en todo el mundo (se calculan unos 350
en concreto: repositorios operativos), siendo la más extendida
Un productor de información será capaz de: de las aplicaciones consideradas. En la actualidad,
Añadir nuevos objetos digitales al repositorio para cuenta con el soporte de una notable comunidad
su almacenamiento. de usuarios y desarrolladores, muy ligada al ámbito
Informar de los metadatos asociados al objeto. académico.

60
Archivo electrónico de las Administraciones Públicas

El paquete DSpace se presenta como una solución com-


Arquitectura modular de DSpace.
pleta, proporcionando toda la funcionalidad necesaria de
un repositorio digital, incluyendo interfaces para el ingreso
Capa de
de ficheros, administración del sistema, consultas sobre el OAI-PMH Simple
Aplicación Statistics Media METS
repositorio, etc. Web UI Data Importer/
Tools Filter Exporter
Provider Exporter

Antes de su ingreso, el sistema encapsula cada fichero


electrónico junto con sus metadatos en un paquete único. API Pública de DSpace
Este paquete, que tiene un identificador único, es la unidad
de almacenamiento del sistema. Capa de Lógica
de Negocio Core Tools Search E-person/
History
(Configuration, (Lucene Group
El hecho de que la herramienta haya estado orientada des- Recorder
logging) Wrapper) Manager
de el principio a la publicación de documentos está limitan-
do su adaptación para otros propósitos. Browse Content Checksum Administration
Tools Management Checker Toolkit
La aplicación se ha construido sobre una arquitectura de
tres capas, formadas por módulos y componentes inde- Submission
Handle Server Handle
pendientes, lo que favorece un encapsulamiento de la fun- Workflow Authorisation
Storage Plug-in Manager
Manager
cionalidad.

El core de la aplicación está formado por los módulos ubica- API de Almacenamiento
dos en la capa de negocio. La inclusión de nueva funcionali-
dad en el core se hace a través del desarrollo de plug-ins. Capa de
RDBMS Wrapper Bistream Storage Manager
Almacenamiento
JDBC SRB
La inclusión de nuevas funciones en la capa de apli- File (Storage
Resource ...
Postgre SQL Oracle System
cación, se hace a través de add-ons. Para ello, incor- Broker)

61
Software de fuentes abiertas en la Administración electrónica

pora un framework de desarrollo, llamado Manakin, Dentro de la filosofía de Fedora Commons está pro-
que proporciona a los desarrolladores una serie de porcionar una plataforma escalable y suficientemente
interfaces para acceder a la funcionalidad del core del flexible para adecuarse a los requisitos de distintas ti-
repositorio. pos de organizaciones.

La comunicación entre los distintos componentes de A partir de la versión 3.0, los desarrolladores de Fedo-
la aplicación se realiza a través de API’s. ra Commons han hecho un importante esfuerzo para
adecuar el modelo de objeto digital soportado por el
Como aspecto negativo indicar que, hasta la fecha, sistema, de modo que sea posible gestionar casi cual-
no se ha potenciado el desarrollo de mecanismos de quier tipo de contenido.
intereoperabilidad basados en Web Services, lo que
dificulta su integración con otros sistemas informá- La evolución de la aplicación se estructura a través de
ticos. dos vías:
Constitución de grupos de trabajo especializados,
Actualmente, no dispone de componentes para la im- orientados a la solución de problemáticas concretas
plantación de políticas de preservación sobre la infor- del sistema (desarrollo de mecanismos de preserva-
mación. ción de la información, gestión de metadatos, etc.).
Colaboración con otros proyectos e iniciativas ex-
6.3.2. Fedora Commons ternas con objeto de generar sinergias y favorecer
Se trata de un proyecto iniciado por la Universidad la evolución tecnológica de la aplicación.
Cornell y la Universidad de Virginia.
El proyecto Fedora Commons se orienta a proporcio-
Su implantación no está tan extendida como otras nar una arquitectura modular fundamentada en un
aplicaciones (DSpace o ePrints) pero cuenta con una core o núcleo (Repository service) que proporciona la
importante comunidad detrás, a la que da soporte una funcionalidad básica del repositorio digital (ingreso,
estructura organizativa consolidada y estable. almacenamiento, consulta, etc.).

62
Archivo electrónico de las Administraciones Públicas

Arquitectura modular de Fedora Commons.

Servicios de
Fedora Federation
Other
PID
Preservation PRO AI Service
Resolution
Monitoring (DAI Provider)

JHOVE
Event Fedora Responsitory Preservation
Notification Service Integrity
(Messaging)
GDFR

ORE Directory
Access Ingest
Point Fedora Fedora External
Search Worldflow Worldflow

Apps

Administrator Diringest Policy Builder Fez/Elated/FIRE

Interfaces Web de usuario

63
Software de fuentes abiertas en la Administración electrónica

El objetivo es, una vez conseguido un core estable, las de la funcionalidad requerida de los módulos de Ingre-
nuevas funcionalidades requeridas por los usuarios se so, Gestión de Datos, Almacenamiento y Consulta.
implementan a través de módulos adicionales que ha-
cen uso de los servicios ofrecidos por el core. Para faci- Esta funcionalidad se completaría mediante desarro-
litar esto, se ha establecido un framework de desarrollo. llos particulares que permitirían incorporar otros pro-
cesos complementarios como validaciones, extrac-
Los servicios proporcionados por el core son accesi- ción de metadatos, generación de representaciones
bles a través de distintos interfaces implementados de los contenidos, etc.
como Web Services:
API-A (SOAP / REST) – proporciona servicios de Fedora Commons no implementa una interfaz de usua-
acceso y recuperación de objetos digitales. rio integrada en la aplicación. En la actualidad hay di-
API-M (SOAP / REST) – proporciona servicios de versas iniciativas que han desarrollado sus propios in-
gestión y administración del repositorio como in- terfaces gráficas (Fez, Muradora, entre otras) y los han
greso de objetos digitales, inserción de metadatos, liberado como software open-source. Estos interfaces
etc. implementan la funcionalidad requerida para el trata-
Basic Search (REST) – servicios de búsqueda por miento de los objetos digitales previo a su ingreso.
texto completo sobre los contenidos almacena-
dos. Como en el caso de DSpace, los objetos digitales se
RI Search (REST) – servicios de búsqueda sobre encapsulan junto con sus metadatos, generando una
el Índice de Recursos del sistema (basado en me- estructura única que actúa como unidad de informa-
tadatos). ción en el sistema.
OAI-PMH provider – servicios para la publicación
de metadatos a otros repositorios. 6.3.3. ePrints
Es un proyecto desarrollado inicialmente por la School
Esta aproximación se adecua bien al modelo de Archi- of Electronics and Computer Science de la Universi-
vo Electrónico propuesto, dando solución a gran parte dad de Southampton (UK), y con una amplia difusión

64
Archivo electrónico de las Administraciones Públicas

principalmente en el entorno académico. Se estima A nivel de usuario, dispone de una interfaz gráfica web
que actualmente existen unos 270 repositorios que lo y una interfaz por línea de comandos que ofrece servi-
implementan. cios de ingreso y recuperación de ficheros. La interfaz
web permite su personalización para adecuarla al look
Sus ventajas son una gran facilidad de uso y su rapi- & feel de la organización.
dez de implantación, lo que lo han hecho muy popular.
Además, una misma instancia de ePrints puede ejecu- La evolución de la aplicación está basada en el de-
tar distintos repositorios concurrentemente. sarrollo de plug-ins, no implementando una interfaz
basada en Web Services. Esto supone una importan-
ePrints permite la definición de estructuras de direc- te limitación a la hora de integrar el repositorio en una
Ejemplo del interfaz de usuario
torios en los repositorios para facilitar la catalogación plataforma tecnológica existente. en ePrints.
de la información de acuerdo a las necesidades de la
organización.

La aplicación está muy orientada a su uso como repo-


sitorio de documentación, función que realiza eficaz-
mente, pero apenas ofrece facilidades para su adapta-
ción a otros usos. Como ejemplo, se puede decir que,
si bien facilita tareas como el ingreso de objetos digi-
tales en el repositorio, no permite validaciones previas
como la comprobación de firma electrónica.

La configuración del sistema se realiza editando los


ficheros de configuración, lo que lo hace más comple-
jo. Actualmente, se está trabajando en el desarrollo de
una interfaz gráfica.

65
Software de fuentes abiertas en la Administración electrónica

Permite exportar los resultados de las búsquedas en dis- proyecto. De este modo, las evoluciones del software
tintos formatos a través de múltiples medios de sindica- se llevan a cabo por un pequeño grupo de personas
ción (RSS, Atom). que han participado en el proyecto desde sus inicios.

La aplicación no proporciona mecanismos para facili- La colaboración con la UNESCO ha favorecido la tra-
tar la ejecución de políticas de preservación. ducción del paquete completo, no sólo de la interfaz
gráfica, a múltiples idiomas, entre ellos el castellano.
6.3.4. Greenstone Digital Library Además se ha favorecido su compatibilidad con múl-
Greenstone surgió como proyecto a partir de una ini- tiples entornos tecnológicos (Linux, Windows, Sola-
ciativa de la National Library of New Zealand (NLNZ) ris, Mac OS-X, FreeBSD).
con sede en la Universidad de Waito, a mediados de
los 90. Es una de las iniciativas pioneras en este tipo Aunque implementa las funcionalidades básicas re-
de soluciones y, de todas las aplicaciones considera- cogidas en los módulos de Ingreso, Almacenamiento
das, es la que tiene un mayor recorrido temporal. y Consulta del modelo OAIS, su diseño no está basa-
do en esta referencia.
La comunidad de Greenstone colabora con la ONG
Human Info y con la UNESCO para extender el uso de En la última versión (v 3.0), se ha rediseñado la aplica-
repositorios digitales en países en vías de desarrollo. ción para favorecer la modularidad y la comunicación
entre componentes vía XML. Los objetos digitales se
Su implantación está menos difundida que las otras empaquetan y almacenan como Greenstone Archival
soluciones (unos 63 repositorios según su web), con Format, que es un encapsulamiento XML que permite
gran influencia en África y Asia. marcar secciones del documento e incluir metadatos
tanto a nivel de documento como de sección.
Cuenta con una comunidad de usuarios significativa,
principalmente archiveros, siendo mucho más limita- El sistema utiliza plug-ins que implementan las funcio-
do el número de desarrolladores que participan en el nes específicas que son invocadas por los procesos

66
Archivo electrónico de las Administraciones Públicas

principales. De este modo es posible añadir nueva fun- Por el contrario, esta aproximación no facilita la adap-
cionalidad al sistema, por ejemplo, la rutina de procesa- tación del código para incorporar nuevas funcionalida-
do de un nuevo tipo de formato. des. En este sentido, sería preferible un diseño orienta-
do a módulos que agrupasen funciones específicas y
6.3.5. OpenEditDam / Razuna / ResourceSpace la definición de interfaces entre ellos.
Del estudio independiente de estas tres aplicaciones
corporativas, se puede concluir que existe una gran si- Sólo ResourceSpace implementa un mecanismo de
militud entre ellas, ya que proporcionan una funcionali- ampliación, basado en plug-ins que permite incorpo-
dad parecida y tienen ventajas y limitaciones similares. rar modificaciones sencillas.

Por ello, se ha optado por presentarlas de manera Ninguna de las tres aplicaciones está fundamentada
conjunta, destacando las diferencias encontradas en en el modelo de referencia OAIS.
durante la comparativa.
Aunque todas ellas permiten ingresar múltiples tipos
Las tres herramientas han sido desarrolladas por empre- de ficheros, su orientación principal es hacía la pu-
sas comerciales que han decidido liberar el código y pro- blicación de ficheros multimedia (imágenes, video,
porcionarlo de manera gratuita, centrando su modelo de audio). De este modo, proporcionan facilidades para
negocio en servicios de soporte especializado y hosting. generar versiones de baja resolución a modo de pre-
Todas ellas se orientan hacía la compartición y publi- vistas, para la transformación de formatos y distintos
cación web de ficheros de una manera sencilla para reproductores dentro de la propia aplicación.
organizaciones de tamaño medio.
Por el contrario, el conjunto de metadatos es limitado
Su desarrollo como aplicaciones monolíticas favore- y muy orientado hacía este tipo de contenidos multi-
ce instalaciones sencillas, que no necesitan de avan- media. En concreto, las tres aplicaciones tiene sopor-
zados conocimientos técnicos y permiten una rápida te para metadatos XMP / IPTC y sólo ResourceSpace
puesta en marcha del repositorio. permite además campos Exif.

67
Software de fuentes abiertas en la Administración electrónica

Hay que mencionar que este tipo de metadatos se es- esto limita toda la interacción con el sistema al interfaz
cribe en el propio fichero del objeto digital, así que la gráfico, lo que dificulta la interoperabilidad con otros
modificación de cualquier metadato supone la altera- sistemas y aplicaciones.
ción del objeto digital, lo que puede complicar la ges-
tión de documentos firmados digitalmente. Finalmente, mencionar que, dado su orientación como
gestores de contenido, no permiten implementar polí-
Aunque el esquema permite la personalización inclu- ticas complejas de autorización y acceso a los objetos
yendo nuevos campos de metadatos de forma manual, digitales.
esta aproximación no se considera operativa cuando se
manejan grandes cantidades de objetos. Esto supone Tampoco permiten establecer relaciones entre distin-
una grave limitación a la hora de incorporar información tos objetos almacenados en el repositorio.
sobre preservación o aspectos técnicos.
La siguiente tabla recoge diversas características
Los tres presentan una interfaz web intuitivo y senci- particulares de cada una de las aplicaciones comen-
llo que favorece un aprendizaje rápido. Sin embargo, tadas:

OPENEDITDAM RAZUNA RESOURCESPACE


Desarrollado por OpenEdit, Inc. Desarrollado por SixSigns. Desarrollado por Montala.
Distribuido bajo licencia GNU Lesser General Distribuido bajo GPL Open Source Licence. Distribuido bajo licencia BSD.
Public Licence. Desarrollado en Java. Desarrollo PHP / MySQL.
Desarrollo Java sobre OpenEdit Framework. Implementa un API básica. Admite plug-in para incluir pequeñas
Opciones de configuración y gestión del sistema Permite conversiones de formato on-the-fly. modificaciones de la funcionalidad.
muy limitadas. Permite “archivar” ficheros (en la práctica los
Equipo de desarrollo reducido.
Contempla la integración con LDAP. elimina de los resultados de las búsquedas)
Documentación técnica escasa y poco explicativa.
No permite configurar permisos a nivel de
usuario.

68
Archivo electrónico de las Administraciones Públicas

6.3.6. iArxiu fueron avanzadas durante la reunión de contraste con


iArxiu es una aplicación impulsada por la Generalitat el personal de la Generalitat de Catalunya, varias se-
de Catalunya a través de la Agència Catalana de Certi- manas antes de su puesta en producción. Pendientes
ficació (CATCERT) y que se orienta a proporcionar ser- aún de un estudio más exhaustivo, a priori parece via-
vicios de Archivo Intermedio y Archivo Histórico para ble su integración como parte de un futuro piloto de
documentos electrónicos. Archivo Electrónico.

Desde hace un tiempo CATCERT ofrece la primera Como incoveniente, indicar sólo que la aplicación
versión de la solución (que ofrece una funcionalidad no está disponible aún como software de fuentes
de archivo de documentos electrónicos básica) a las abiertas, por lo que no se ha incluido en el estudio
Entidades Locales de Cataluña para su uso, a través realizado. CATCERT ya ha manifestado su interés por
de acuerdos de colaboración. liberarla a corto plazo y facilitar la constitución de una
forja que de soporte a su evolución.
En paralelo, el software a sido completamente revisa-
do y rediseñado, dando lugar a una nueva versión (iAr- 6.3.7. Alfresco
xiu v.2.0), que acaba de salir a producción. Esta nue- Fruto de las entrevistas de contraste realizadas, se
va versión ha sido definida tomando como referencia ha constatado que distintas Administraciones Públi-
OAIS e implementa gran parte de la funcionalidad de- cas están adoptando Alfresco como una solución de
finida en el modelo. Archivo Electrónico a corto y medio plazo, por lo que
se ha considerado interesante incluirlo en el estudio
Esta aplicación es una de las pocas soluciones existen- realizado.
tes de Archivo Electrónico planificadas y diseñadas para
cubrir los requerimientos reales de la Administración Alfresco es una aplicación de Gestión Documental
Pública, dando respuesta a la problemática asociada a open-source diseñada para facilitar la gestión cola-
la preservación de la información digital a largo plazo. borativa de documentos electrónicos. Sus objetivos
Las características principales de la nueva aplicación son:

69
Software de fuentes abiertas en la Administración electrónica

Favorecer la creación y versionado de documentos Los documentos electrónicos se almacenan en el sis-


en entornos compartidos. tema dentro de contenedores (spaces) que permiten
Favorecer la clasificación de los documentos elec- la definición de reglas. Estas reglas permiten la ejecu-
trónicos archivados. ción de ciertas acciones en respuesta a un evento.
Facilitar el acceso a estos documentos electróni-
cos. Alfresco define los documentos electrónicos de archi-
vo (records) como los documentos incluidos en unos
En este aspecto, no puede considerarse un reposito- spaces especiales llamados filesplans, que añaden la
rio digital en los términos que se han empleado hasta siguiente funcionalidad extra:
ahora. Permiten la definición de periodos de conservación
para los records almacenados. Pasado este perio-
Sin embargo, es posible extender su funcionali- do, el record se marca como obsoleto.
dad básica añadiendo ciertos mecanismos para la Incorporan nuevos metadatos para ampliar la infor-
conservación de documentos electrónicos. Estos mación relacionada con el record.
mecanismos se orientan a mejorar la catalogación Añade nuevos tipos de reglas relacionadas con la
y monitorización de la información, en ningún caso gestión de archivos (eliminación de records cuando
abordan la problemática de la obsolescencia de for- quedan obsoletos, extracción automática de meta-
matos y soportes. En vista de esto, Alfresco sólo re- datos en el ingreso).
sulta viable como implantación del Archivo Local o
de Oficina. Alfresco gestiona un conjunto predefinido de metadatos
(propiedades). Estos metadatos pueden utilizarse como
La interacción del usuario con Alfresco se realiza a tra- parámetros de búsqueda avanzada sobre el repositorio.
vés de una interfaz web, por lo que no es necesario Es posible configurar nuevos campos de metadatos
la instalación de ningún aplicativo cliente. Además es editando uno de los ficheros de configuración de la
posible ingresar, mover o borrar ficheros a través de aplicación. Estas modificaciones son comunes a to-
interfaces FTP, WebDAV y CIFS. dos los records, no permitiendo por este método la

70
Archivo electrónico de las Administraciones Públicas

definición de metadatos particulares según el tipo de 6.4. Diseño de la implantación piloto


contenido almacenado.
A partir de los resultados de la comparativa entre las
Sólo cuando el ingreso del documento electrónico se distintas soluciones analizadas, se ha considerado
hace vía interfaz de usuario es posible informar todos que Fedora Commons ofrece una serie de caracte-
los metadatos asociados. En el resto de opciones (FTP, rísticas que facilitarán el diseño de una implantación
WebDAV, CIFS), sólo podrán incorporarse aquellos piloto:
metadatos que puedan extraerse automáticamente. Es una herramienta basada en el modelo OAIS, lo
que favorece su alineamiento con el modelo con-
Los metadatos en Alfresco se almacenan en una Base ceptual de Archivo Electrónico.
de Datos independiente, separados de los ficheros Cuenta con el soporte de una nutrida comunidad.
electrónicos a los que se refieren. Esta característica El diseño de Fedora Commons se orientado hacía
puede resultar problemática a la hora de transferir fi- una arquitectura modular, lo que facilita el desarro-
cheros a otro Archivo Electrónico ya que habría que llo de nuevos componentes y su integración con los
implementar la forma de adjuntar los metadatos junto ya existentes.
con los documentos a transferir. Implementa interfaces vía Web Services, por lo que
puede integrarse dentro de una arquitectura SOA.

Esto no quiere decir, que la implantación del siste-


ma de Archivo Electrónico deba estar basada en
Fedora Commons. Este diseño tecnológico es prin-
cipalmente un ejercicio teórico, en el que se toma una
aplicación tipo de repositorio digital, en este caso Fe-
dora Commons, y se contrasta con el modelo concep-
tual presentado anteriormente.

71
Software de fuentes abiertas en la Administración electrónica

A partir de este contraste, se determinarán las caren- Para el análisis se utilizará la definición funcional del
cias funcionales típicas y esperables, y se identifica- modelo presentada en el capítulo anterior y que seg-
rán componentes de software de fuentes abiertas que mentaba el sistema de Archivo en módulos con fun-
puedan solventarlas. cionalidad similar.

Hecha esta puntualización, nada impide que, llega- De este modo, es posible analizar en que grado la he-
da la hora de abordar un diseño real, sea preferible rramienta de repositorio cubre los requerimientos de
adoptar otro sistema diferente, como por ejemplo cada uno de los módulos y determinar aquellas fun-
iArxiu, como núcleo del futuro sistema. cionalidades que se deberán implementar a través
Entre las carencias típicas fruto del contraste del mo- de componentes adicionales de software de fuentes
delo con la aplicación de repositorio digital cabe espe- abiertas.
rar las siguientes: Como se ha comentado antes, la elección de las com-
Implementación de Cuadros de Clasificación para ponentes concretos pretende ser meramente orienta-
la catalogación de los documentos. tiva, prefiriéndose la adopción de estándares recono-
Existencia de interfaces adecuados de usuario. cidos que definan procedimientos para el intercambio
Mecanismos de transferencia de documentos entre de datos entre los componentes del sistema.
distintos Archivos.
Mecanismos para la monitorización y evaluación de En las secciones siguientes, se aborda cada uno de
formatos de fichero. los distintos módulos funcionales del modelo.
Sistemas de control de accesos suficientemente
restrictivos.
Visualizadores adecuados para distintos tipos de
contenidos digitales.

72
Archivo electrónico de las Administraciones Públicas

Modelo funcional de un sistema


de Archivo Electrónico.

Sistema de Módulo
información de de Firma
organismos Electrónica

Productor

Conservación Transferencias

Gestión de datos

Pre-ingreso Ingreso Almacenamiento Consulta y acceso


Usuarios

Configuración y administración

Archivo físico Archivo Electrónico

73
Software de fuentes abiertas en la Administración electrónica

6.4.1. Módulo de pre-ingreso Metadatos preservación: correspondientes a pe-


Su propósito es facilitar la transferencia de datos entre los riodos de vigencia, pistas de auditoría, etc.
productores y el Archivo, estableciendo los criterios for-
males para la admisión de los contenidos en el sistema. Con objeto de favorecer la interoperabilidad y el in-
Este módulo no forma parte del sistema de Archivo tercambio de información entre repositorios, se reco-
Electrónico. Sus funciones se integrarán dentro de mienda el uso de esquemas de metadatos estandari-
las aplicaciones de Gestión Documental de la organi- zados y de amplia difusión.
zación o través de una aplicación dedicada que sirva
como interfaz de usuario para el ingreso manual de La herramienta permitirá su configuración con dis-
documentos. tintos esquemas. Así, aunque el estándar de facto
para metadatos descriptivos es Dublin Core, debe-
La entrada del módulo serán los ficheros electrónicos ría tenerse en cuenta la posibilidad de incluir otros
con los contenidos a preservar, así como información complementarios. Del mismo modo, se considerará
complementaria (metadatos) que facilite la clasifica- el uso de esquemas diferentes en función de la natu-
ción e identificación de los contenidos para su conser- raleza del contenido a ingresar.
vación y recuperación futura.
Tanto los contenidos como los metadatos se encap-
De forma genérica, la información requerida al provee- sularán juntos dentro de una estructura predetermi-
dor será: nada, llamada paquete SIP (Submission Information
Metadatos descriptivos: nombre del objeto, nom- Package), y que será la unidad de información que se
bre de la unidad que lo produce, tipología, etc. ingresará en el Archivo.
Metadatos técnicos: relativos al formato de fichero
empleado, a la firma digital, etc. Este paquete tendrá una estructura predefinida y
Metadatos estructurales: referentes a la composi- adecuada para facilitar su procesado automatizado
ción interna del documento o a las relaciones con por el sistema de Archivo. En este sentido, la tenden-
otros documentos almacenados en el archivo. cia generalizada es el mercado es el encapsulamien-

74
Archivo electrónico de las Administraciones Públicas

to XML, principalmente basado en la especificación Este módulo deberá permitir clasificar los documen-
METS. tos a ingresar dentro de un esquema jerárquico (cua-
dro de clasificación).
Con objeto de facilitar la preservación y recuperación
de los contenidos en el futuro, se recomienda restrin- Fedora Commons dispone de un módulo que facilita
gir el ingreso de documentos en el sistema a un con- la creación de paquetes METS.
junto reducido de formatos definidos previamente y
consensuados entre productor y archivo. Asimismo, Fedora Commons no impone restriccio-
nes respecto a los distintos esquemas de metadatos
Al final del documento se proporciona una lista de que puede gestionar.
formatos recomendados, cuyas características los
hacen adecuados para la preservación de los datos a
lo largo del tiempo. Estándares

Asimismo, es importante destacar la problemática asocia-


da al ingreso en el archivo de documentos firmados elec-
trónicamente. La validez jurídica de estos documentos
puede llegar a perderse si en el futuro no se dan las condi-
ciones que permitan verificar la autenticidad de la firma. Componentes open-source

Para evitar esto, se propone el resellado de toda la


documentación recibida en el sistema de Archivo
Electrónico, previa verificación de la validez de la
firma digital. Para ello, el paquete SIP deberá incor-
porar tanto la firma del documento como los datos
necesarios para su validación.

75
Software de fuentes abiertas en la Administración electrónica

6.4.2. Módulo de ingreso metadatos, principalmente de carácter técnico, que


Este módulo gestiona el ingreso de información en el completen la información provista por el productor.
sistema de archivo. Esta información debe recibirse co-
rrectamente estructurada en un paquete SIP. De nuevo, se recomienda el uso de esquemas de meta-
datos estandarizados como:
A partir de la recepción del paquete SIP, el módulo rea- Metadatos técnicos: MIX (para imágenes), AudioMD
lizará una serie de validaciones para asegurar la integri- (para audio), TEI (para texto)
dad y adecuación de la información a ingresar: Metadatos de preservación: PREMIS
Comprobación formal de la estructura del paquete SIP.
Validez del objeto digital de acuerdo al formato de fi- Finalmente, el paquete SIP será transformado en un
chero indicado. paquete AIP (Archival Information Package). El paque-
Antivirus. te AIP es la estructura en la que la información será al-
Información de los metadatos requeridos. macenada por el repositorio. Este enfoque garantiza la
preservación de los contenidos y sus metadatos aso-
A continuación, se validará la autenticidad de la firma de ciados como de una misma unidad.
negocio (si existiese). En caso positivo, se aplicará un
resellado temporal sobre el documento firmado y sobre A cada paquete AIP se le asignará un identificador úni-
la información empleada para la validación de la firma. co y perdurable (PID) que se usará para referenciarlo
en el futuro dentro del sistema.
Con ello, el Archivo podrá “da fe” de la validez jurídica
del documento en el momento del ingreso, de modo Hay que mencionar que la correspondencia entre SIP
que quede constancia de su autenticidad incluso si en y AIP no es necesariamente uno a uno, siendo posible
el futuro no pudiese repetirse esta verificación. que un SIP genere varios AIP y viceversa.

En los SIP que hayan superado el proceso, los objetos Fedora Commons implementa los servicios necesarios
digitales será procesados para la extracción de nuevos para el ingreso del SIP y la generación del AIP. Sin embargo,

76
Archivo electrónico de las Administraciones Públicas

deberá abordarse la integración de nuevos componentes Estándares


que implementen las distintas validaciones propuestas,
así como la extracción automatizada de metadatos.
AUDIOMD TEI
Hay que destacar también entre las carencias identifi-
cadas, el hecho de que Fedora Commons no cumple
JSR-170 XACML
actualmente con el estándar JSR-170 (Content Repo-
sitory for Java).

Esta norma especifica un interfaz estándar para re- Componentes open-source


positorios de contenidos, lo que permite integrarlos
fácilmente con cualquier aplicación de gestión de VTLS NLNZ
contenidos compatible. De este modo, se favorece la Metadata Metadata
separación entre las aplicaciones de cliente y el repo- Extraction Extraction
sitorio, favoreciendo la sustitución de componentes y
alargando la vigencia de la solución final.

JSR-170 define dos niveles de compatibilidad. En este


caso, sería necesario implementar tanto el nivel 1 (lec-
tura) como el nivel 2 (escritura en el repositorio).

La aproximación que se considera más factible sería el


desarrollo de una capa intermedia entre la interfaz pro-
pietaria de Fedora y la API Java definida en el estándar.

77
Software de fuentes abiertas en la Administración electrónica

6.4.3. Módulo de almacenamiento Esta característica debe estar complementada con un


El módulo de almacenamiento es el responsable de riguroso control de accesos a los datos almacenados,
la conservación de los paquetes AIP, por lo que pro- dado el carácter privado de una parte de la documen-
porcionará mecanismos adecuados de back-up y de tación archivada, limitándose su acceso a los funcio-
redundancia que aseguren la disponibilidad de la in- narios al cargo y a los propios interesados.
formación.
Idealmente, el módulo deberá ser capaz de interactuar
Así mismo, establecerá los procesos adecuados para con distintas tipos de almacenamiento físico (discos,
gestionar la recuperación de los paquetes a partir de cintas LTO, SAN) , lo que permitiría optimizar el acceso
su PID conocido. utilizando medios más rápidos para los datos de con-
sulta más frecuente.
Complementariamente, este módulo proporcionará
los medios para realizar consultas sobre el contenido En la actualidad, Fedora Commons no implementa
de los paquetes AIP, dando la posibilidad de realizar una gestión avanzada de medios, por lo que sería re-
búsquedas por texto. comendable estudiar su integración con un gestor de
almacenamiento.

Componentes open-source

78
Archivo electrónico de las Administraciones Públicas

6.4.4. Módulo de gestión de datos


Representación XML de una tripleta.
Con objeto de optimizar las consultas, el sistema extrae-
rá parte de los metadatos incluidos en los paquetes AIP 1
<rdf:Description rdf:about="paqueteFedora.100">
y los registrará en un Índice de Recursos. Este módulo 2 <dc:title> "Documento_n123" </dc:title>
será responsable de la gestión de esta información, así </rdf:Description> 3
como de establecer las relaciones entre los campos al-
macenados y los paquetes AIP a los que se refieren.

La información manejada por el módulo será:


API de API de Búsqueda Consulta
Metadatos estructurales (definen la relación entre Gestión Acceso en registro RDF
documentos almacenados en el archivo).
Metadatos descriptivos (principalmente basados
en el esquema Dublin Core). Almacenamiento de información
Almacén Registro Índice RDF en Fedora Commons.
Referencias a los paquetes AIP almacenados en el
repositorio (PID).

File System RDBMS Tripleta


Por defecto, Fedora Commons delega estas funcio- (objetos) (Registro( (índice)
nes en una Base de Datos Mulgara ya integrada. Mul-
gara es una BD RDF y difiere de una BD relacional en
que está optimizada para establecer relaciones en for- Estándares Componentes open-source
mato tripleta.

Una tripleta se compone de tres valores:


1. Recurso (identificador del objeto digital archivado)
2. Propiedad (propiedad o tipo de metadato)
3. Valor (característica asociada al metadato)

79
Software de fuentes abiertas en la Administración electrónica

6.4.5. Módulo de consulta y acceso Esta aproximación da la posibilidad de tratar los obje-
Los usuarios finales harán uso de los servicios de este tos digitales solicitados previamente a su representa-
módulo para realizar consultas sobre la información al- ción, abriendo las posibilidades a la implementación de
macenada y acceder a una visualización de los docu- visores y emuladores.
mentos almacenados en el Archivo Electrónico.
Estas consultas podrán realizarse: El modelo de datos de Fedora Commons está diseñado
Sobre la BD de metadatos incluida en el módulo de para la generación de distintas representaciones de un
Gestión de Datos. mismo objeto digital.
Sobre el contenido de los paquetes AIP almacena-
dos en el repositorio. Sin embargo, Fedora no dispone una interfaz de usuario
(IU) propia por lo que será necesario la integración de al-
Como resultado de estas búsquedas se presentará un guna de las IU existentes o el desarrollo de una a medida.
listado de los paquetes que cumplan con los criterios Al igual que en el módulo de ingreso, se recomienda la
de búsqueda. adopción del estándar JSR-170.

A partir de los resultados de las búsquedas, los usua-


rios podrán solicitar la consulta de los documentos ar-
chivados (siempre en modo lectura). Para ello, el siste-
ma generará una copia del paquete con la información
requerida.

A esta copia se le denomina Dissemination Information


Package (DIP) y puede presentar una encapsulación
distinta al AIP. El hecho de proporcionar una copia del
paquete implica que, además de los contenidos, tam-
bién se distribuyen los metadatos.

80
Archivo electrónico de las Administraciones Públicas

Con objeto de proteger la confidencialidad de la infor- Estándares


mación registrada en el Archivo, este módulo deberá
implantar mecanismos eficaces de control de acceso.
JSR-170 XACML
Esta restricción debe imponerse tanto a la visualización
de documentos como a la recuperación de resultados
de búsquedas.

En este sentido, se propone adoptar el estándar Componentes open-source


XACML, que define la sintaxis y los procesos para la de-
finición y aplicación de políticas de autorización com-
plejas y flexibles.

Repositorio

Repository interface Layer (JSR-170)

Aplicación
CMS
Web

Interoperabilidad JSR-170.

81
Software de fuentes abiertas en la Administración electrónica

6.4.6. Módulo de configuración y Como se ha ido apuntando en las secciones anteriores, el


administración control sobre el acceso a la información exclusivamente
La finalidad de este módulo será la gestión de la aplica- por los usuarios interesados es un aspecto vital del siste-
ción de Archivo Electrónico, siendo sus usuarios princi- ma. Por ello, se deberá hacer un esfuerzo para la definición
pales los administradores del sistema. y mantenimiento de políticas de seguridad apropiadas.

Las principales tareas que comprende: La funcionalidad de Fedora Commons no parece sufi-
Gestión de usuarios. ciente para proporcionar el nivel de control adecuado
Definición de políticas de acceso a los objetos del sobre el sistema por lo que se considera necesario com-
repositorio. plementarla con otros componentes, como un gestor
Ejecución de procesos (copias de seguridad, migra- de directorio LDAP o un programador de procesos.
ción de ficheros, actualización de firmas de virus).
Monitorización del sistema y generación de informes. Fedora Commons proporciona un interfaz web para la
Auditorías del sistema. administración del sistema.

Estándares

XACML LDAP

Componentes open-source

JavaLogin API

82
Archivo electrónico de las Administraciones Públicas

6.4.7. Módulo de preservación Sin embargo, no proporciona ninguna funcionalidad


orientada a la evaluación de la obsolescencia de los
Este módulo se orientará a tareas relacionadas con la ficheros empleados.
monitorización de la evolución de formatos de archivo,
así como a la planificación y definición de políticas orien- Durante el estudio, no ha sido posible identificar una
tadas a la preservación de los contenidos archivados. aplicación en el mercado que automatice esta tarea.

Su finalidad es proporcionar mecanismos para ase- Sin embargo, sí existen aplicaciones y servicios de
gurar que la información almacenada puede ser re- información sobre formatos de archivo que pueden
presentada a los usuarios incluso después de largos servir de referencia a un experto para la definición de
periodos de tiempo. Los métodos que actualmente se políticas de conservación eficaces.
consideran más viables para ello son la migración de
formatos y la emulación. Estándares

Complementariamente, deberá hacerse un segui-


miento de la caducidad de los certificados digitales
usados para hacer el resellado temporal de los paque-
tes que han ingresado en el sistema. En caso de que Componentes open-source
se acerquen al final de su vida útil, deberá gestionarse
su renovación y planificar un nuevo resellado de los
PKP Open Archive
paquetes. Harvester

Fedora Commons permite el almacenamiento de dis-


tintas versiones de un mismo fichero dentro del pa- (1)

quete AIP, lo que da la posibilidad de acometer migra-


ciones a nuevos formatos manteniendo los originales. (1)
GDFR se encuentra en fase experimental, por lo que sus creadores no recomiendan su uso en entornos productivos.

83
Software de fuentes abiertas en la Administración electrónica

6.4.8. Módulo de gestión de transferencias Generación de listados de paquetes a transferir.


Este módulo tiene como propósito facilitar la gestión Identificación de los documentos que han excedido
de transferencias de documentación entre los distin- su periodo de vigencia en el archivo.
tos tipos de Archivo Electrónico de la Administración Revisión de la documentación previa a su ingreso
Pública. en el siguiente archivo.
Edición de metadatos para facilitar una clasifica-
Es un añadido al modelo OAIS, que no lo contempla, ción más adecuada de la documentación.
y se incorpora al modelo para identificar una serie de Registro de las autorizaciones y rechazos sobre las
funciones específicas proporcionadas por los distin- transferencias realizadas.
tos módulos y que en este caso tienen un peso sufi-
ciente como para ser agrupadas en un módulo aparte. Los paquetes identificados para su transferencia se-
Esta funcionalidad comprenderá: rán generados como paquetes DIP en el fichero origen
y enviados al fichero destino en forma de paquete SIP.
Estándares
En principio, se recomienda mantener el mismo for-
WfMC mato para paquetes DIP y SIP con objeto de evitar la
necesidad de un convertidor intermedio.

El proceso podría automatizarse a través del empleo


Componentes open-source de una herramienta de workflow, lo que permitiría au-
tomatizar las tareas de envío y aceptación de la do-
cumentación. Se recomienda que estas herramientas
cumplan con la recomendación WfMC.

84
Archivo electrónico de las Administraciones Públicas

6.4.9. Esquema de componentes del piloto


A continuación se presenta como queda el esquemas de componentes del piloto.

Conservación
Transferencias
PKP Harvester

Gestión de datos

Pre-ingreso

MD Extractors

Ingreso Almacenamiento Consulta y acceso

Configuración Java Login API

85
07.
Mapa de componentes
Archivo electrónico de las Administraciones Públicas

7. Mapa de componentes

El presente mapa de componentes es el resultado de Adecuación funcional a los requerimientos del Ar-
un estudio del mercado, cuyo objetivo ha sido iden- chivo Electrónico de las AAPP.
tificar aplicaciones y componentes de software de Facilidad de integración con otros componentes y
fuentes abiertas susceptibles de completar la funcio- aplicaciones.
nalidad de una aplicación de repositorio digital tipo, de Grado de madurez tecnológica del producto.
modo que se pueda conformar una implementación
del Modelo Conceptual propuesto.
7.1. Identificación de categorías de
Debe tenerse en cuenta que el presente proyecto no persi- componentes
gue generar un diseño cerrado del sistema de Archivo Elec- Para dar solución a los gaps funcionales, se han iden-
trónico, sino más bien comprobar su viabilidad en el ámbito tificado las siguientes categorías de componentes.
del software de fuentes abiertas. Por ello, las soluciones Validador de formato de fichero
incluidas en el mapa de componentes deben considerarse Planificador de tareas
sólo como una recomendación, siendo susceptibles de ser AOI-PMH harvester
sustituidas por otras si se considerase apropiado cuando Gestor de Bases de Datos RDF
se aborde el diseño de un prototipo real. Gestor de directorio LDAP
Registro de logs
En este sentido, se ha intentado identificar distintos Interfaz gráfica para Fedora Commons
productos para cada uno de los componentes a inte- Framework para workflow
grar, otorgando a los desarrolladores la posibilidad de Framework para el desarrollo de aplicaciones web
elegir la que crean más adecuada. Extractores de metadatos
Registro de metadatos de formatos de fichero
Los criterios utilizados para la selección de los produc- Antivirus
tos incluidos en el mapa de componentes han sido: Gestor de backup

89
Software de fuentes abiertas en la Administración electrónica

7.1.1. Validador de formato de fichero Estos módulos tienen su utilidad como verificadores
Este tipo de software permite identificar el formato de fi- de los ficheros digitales que ingresan en el sistema, así
chero y validarlo contra sus especificaciones públicas. como comprobadores de la correcta ejecución de las
acciones de migración.

JHove Droid
• Es un software patrocinado por la Library of Congress (USA). • Desarrollado por The National Archives (UK).
• Presenta una API que facilita su integración en distintos • Usa como fuente de formatos el PRONOM Technical Registry.
sistemas. • Implementa un API bien documentado para su integración
• Permite la validación de múltiples formatos de archivo, entre con otros sistemas.
otros: • Permite la interacción a través de:
• Imagen fija: GIF, PNG, JPEG, TIFF • Línea de comandos.
• Texto / etiquetado: ASCII, HTML, XML • Un interfaz gráfico de usuario.
• Documentos: ODF, PDF, OfficeXML • Se distribuye bajo licencia BSD.
• Audio: AIFF, WAV
• Actualmente se considera la solución de validación de
formato más extendida.
• Se distribuye bajo licencia GNU Lesser General Public
License (LGPL)
• La versión 2 se espera para principios de 2010. Este nuevo
desarrollo permitirá nueva funcionalidad como la validación
de ficheros de acuerdo a políticas locales.

90
Archivo electrónico de las Administraciones Públicas

7.1.2. Planificador de tareas 7.1.3. AOI-PMH harvester


Su función es la ejecución automatizada de procesos La finalidad de este componente es facilitar la publi-
de acuerdo a una planificación previa. cación de metadatos a otros repositorios, a través del
protocolo AOI-PMH, implementando una caché que
Quartz Enterprise Job Jcrontab libera al repositorio origen de la tarea de responder las
Scheduler consultas solicitadas por otros sistemas.
• Software soportado por • Es una implementación en
OpenSymphony. Java de la funcionalidad
proporcionada por el Adicionalmente, los dos componentes considerados
• Se distribuye bajo licencia
Apache v.2.0. comando cron de Unix. permiten también la realización consultas de informa-
• Permite dos opciones • Sólo permite el ción sobre otros repositorios.
para el lanzamiento de las lanzamiento de
tareas: tareas en momentos
Metalis PKP Open Archive
predeterminados (ejemplo,
• Informando la fecha una fecha exacta o un
Harvester
exacta y/o periodo de periodo de tiempo). • Distribuido bajo licencia • Distribuido bajo licencia
ejecución (ejemplo, cada GNU GPL. GNU GPL.
lunes a las 10:30). • La definición de eventos se
hace a través de un fichero • Compatible con AOI-PMH • Compatible con OAI-PMH
• Como respuesta a un de configuración. v.2. v.1.1 y v.2
evento generado por
una rutina programada • Se distribuye bajo licencia • Tiene soporte para • Tiene soporte para
(ejemplo, cada vez que GNU Lesser General metadatos DC, pero no metadatos DC y MODS.
se reciba un número Public License (LGPL). para MODS. • Permite dos tipos de
determinado de • Permite dos tipos de búsquedas:
ficheros). búsquedas: • Simples: keywords en
• Simples: keywords en todos los campos.
todos los campos. • Complejas: keywords y
• Complejas: keywords y frases limitados sólo a
frases limitados sólo a algunos campos.
algunos campos.

91
Software de fuentes abiertas en la Administración electrónica

7.1.4. Gestor de Bases de Datos RDF 7.1.5. Gestor de directorio LDAP


Gestiona la Base de Datos RDF donde se almacenan Permite la implantación de un directorio LDAP para la
los metadatos descriptivos y estructurales, estable- gestión de cuentas de usuario.
ciendo referencias perdurables a los paquetes AIP al-
macenados en el repositorio. Esta información define a los usuarios del sistema y es
requerida para la implementación de políticas de acce-
Esta Base de Datos mantiene índices de acuerdo a los so y seguridad en el sistema.
valores de campos de metadatos concretos para ace-
lerar su búsqueda. OpenLDAP Apache Directory Server
• Distribuido bajo licencia • Distribuido bajo licencia
propia (OpenLDAP Public Apache v.2. y desarrollado
Debido a su alto grado de integración con Fedora Com-
Licence). por la Apache Software
mons, no se recomienda ninguna solución para este Foundation.
• Desarrollado por The
componte distinta de Mulgara RDF, ya que cualquier OpenLDAP Project. • Codificado en Java.
otra tecnología precisaría de una complejo trabajo de • Posiblemente es la • Además de a LDAP, da
integración. implementación LDAP soporte a otros protocolos
open-source más popular como Kerberos.
debido a su adopción por
multitud de distribuciones
Linux.

92
Archivo electrónico de las Administraciones Públicas

7.1.6. Registro de logs 7.1.7. Interfaz gráfica para Fedora Commons


Componente de librería que proporciona funciones Existen distintas iniciativas de software open-source
para ampliar las capacidades de trazabilidad y registro para solucionar la carencia de una interfaz gráfica de
de eventos del sistema. usuario integrada con Fedora Commons.

La incorporación de este componente posibilita una A continuación se presentan dos de los GUI’s más ex-
mayor flexibilidad a la hora de generar trazas en res- tendidos:
puesta a circunstancias específicas.
Fez Muradora
Log4J Java.util.logging • Código liberado por The University of Queensland • Código Java liberado por el Macquarie University
Library. E-learning Centre of Excelence.
• Código liberado por • No es una aplicación
la Apache Software independiente sino una • Distribuido bajo licencia GNU GPL. • Distribuido bajo GNU Lesser General Public
Foundation. librería dentro de la • Implementado en PHP. Licence.
• Distribuido bajo licencia plataforma Java para la • Mejora el sistema de autorización de Fedora. • Persigue mejorar las funciones de autentificación
Apache v.2.0. generación de logs. • Permite la autorización a través de servicios de Fedora (permite integración con Shibboleth,
• Disponible a partir de la single sign-on como Shibboleth. servicio federado de autentificación).
• Presenta una API que
puede ser invocada desde versión 1.5. del Java SE • Permite la implementación de flujos de revisión y • Posibilita una mayor flexibilidad para la
distintas aplicaciones Development Kit. publicación. implantación de políticas de autorización.
para la generación de logs • Permite administrar vocabularios controlados • Permite definir colecciones de objetos digitales de
con distintos niveles de (definición y mantenimiento de códigos para la una forma sencilla.
especificación. clasificación de documentos).
• Implementa métodos básicos de gestión y
• Permite la integración con Jhove para la
mantenimiento de estos objetos.
validación de formatos de fichero.
• Implementa su propio índice de búsqueda • Implementa distintos métodos de consulta del
para ampliar las posibilidades de consulta que repositorio:
proporciona Fedora. • Simple: por texto.
• Complejas: por campos de metadatos.
• Por colección.

93
Software de fuentes abiertas en la Administración electrónica

7.1.8. Framework para workflow 7.1.9. Framework para el desarrollo de


Facilitan mecanismos establecer procesos de trabajo aplicaciones web
relacionados con el envío y revisión de transferencias Se ha considerado apropiado la inclusión en el mapa
de paquetes entre sistemas de Archivo. de componentes de un framework para el desarrollo
de aplicaciones java, dado que posiblemente sea ne-
Permiten informatizar el registro de los movimientos cesario el desarrollo ad-hoc de cierta funcionalidad
de información entre los distintos tipos de Archivo. (p.e. nuevos interfaces gráficos de usuario).

Enhyndra Shark ObjectWeb Bonita En la actualidad existen distintos frameworks basados


• Código liberado por • Código liberado por en software de fuentes abiertas y la elección de uno u
Enhydra. ObjectWeb bajo licencia
otro suele estar condicionada por las preferencias y
• Distribuido bajo licencia GNU LGPL.
experiencia previa del equipo programador.
GNU LGPL. • Es una herramienta
• Es un framework que de workflow flexible
permite la implantación basada en WfMC. Por ello, más que proponer productos concretos, se
de servidores de workflow • Proporciona una interfaz ha considerado más conveniente recomendar la apli-
integrados. web.
cación de estándares de desarrollo reconocidos que
• Su implementación • Permite su integración
garanticen la calidad de las aplicaciones resultantes.
se basa en las con otras aplicaciones a
especificaciones WfMC y través de SOAP y XML.
XPDL. Esto, además de favorecer la interoperabilidad, dota
de una mayor libertad a los desarrolladores que podrán
elegir entre aquellas que cumplan con los estándares.

El diseño deberá seguir una arquitectura en capas, de


modo que se establezca una separación de los com-
ponentes de la aplicación y se favorezca la reutiliza-
ción del código.

94
Archivo electrónico de las Administraciones Públicas

La división típica es: capa de presentación –capa de 7.1.10. Extractores de metadatos


lógica de negocio– capa de integración de sistemas Componentes que permiten la generación automati-
corporativos (EIS). zada de metadatos de tipo técnico a partir de la ins-
pección del objeto digital.
Para la capa de presentación se recomienda la adop-
ción de Java Server Faces (JSF), cuya primera versión Dado que no existe un único sistema que extraiga todos
está especificada por el estándar JSR-127. metadatos que pueden ser necesarios, se propone la im-
plementación de las soluciones en paralelo.
Esta especificación está implementada en la platafor-
ma Java Enterprise Edition a partir de la versión 5. VTLS Metadata Extraction Service NLNZ Metadata Extraction
• Servicio Web proporcionado por VTLS • Aplicación desarrollada por la National Library
• Permite la captura de metadatos para imágenes of New Zealand (NLNZ)
Respecto a la capa de integración de sistemas, donde
fijas según el esquema de metadatos MIX. • Distribuido bajo licencia Apache v.2.0.
se implementa el mapeo entre objetos lógicos y bases
• Facilita su integración con Fedora ya que • Permite el análisis de distintos formatos
de datos relacionales, la sugerencia es programar en empaqueta los metadatos recopilados con un de objetos digitales (documentos Word y
base a la Java Persistence API (JPA), estandarizada en formato adecuado para su almacenamiento como OpenOffice, PDF, MP3, WAV y otros)
la norma JSR-317. datastream. • La información de salida se entrega en un
• Permite lanzar validaciones sobre Jhove. formato XML estándar.
Esta especificación también está implementada en la
plataforma Java EE 5, así como en otros productos de
amplia difusión como Hibernate.

A partir de estas consideraciones, la elección del IDE a


utilizar quedará a la elección del equipo desarrollador.

La aplicación de esta tecnología se identi-


ficará en el mapa de componentes como:

95
Software de fuentes abiertas en la Administración electrónica

7.1.11. Registro de metadatos de formatos de 7.1.12. Antivirus


fichero Como medida preventiva para garantizar la seguridad
Se trata de un servicio remoto que mantiene informa- del sistema, se deberá asegurar que los objetos digita-
ción actualizada sobre las características técnicas y la les que ingresen en el archivo estarán libres de virus.
vigencia de distintos formatos de fichero electrónico.
Para ello, se requerirá un escaneo de los ficheros in-
Su consulta permite la identificación de formatos que cluidos en el paquete SIP durante las validaciones
han quedado obsoletos, así como la recomendación efectuadas por el módulo de ingreso del sistema.
sobre políticas de migración de estos formatos a otros
formatos con mayor vigencia. En el mercado existen actualmente varios antivirus open-
source que pueden utilizarse para este cometido. La elec-
No implica la instalación de nuevos paquetes de soft- ción de uno u otro estará determinada, además de por la
ware, pudiéndose acceder a varios de ellos en parale- propia funcionalidad del producto, por la existencia de un
lo con objeto de recopilar la información más comple- soporte post-implantación adecuado (principalmente re-
ta posible. lacionado con la actualización de firmas de virus).

Hay que tener en cuenta que el GDFR aún se encuen- Clam Antivirus UNA Antivirus Toolkit
tra en fase de desarrollo y sus desarrolladores no reco- • Toolkit de antivirus • Soportado sólo por
desarrollado para sistemas sistemas Unix.
miendan su uso en sistemas productivos.
Unix. • Licenciado bajo licencia
• Liberado bajo licencia GPL. GPL.
Pronom Global Digital Format Registry
• Es con mucho la opción • Soporte limitado ya
más extendida. que cuenta con una
comunidad reducida.

96
Archivo electrónico de las Administraciones Públicas

7.1.13. Gestor de backup


Software que proporciona mecanismos para generar Su implantación es vital para la restauración de la in-
copias de seguridad del repositorio de paquetes al- formación en caso de que se corrompan los datos o el
macenados por el Archivo. software que les da soporte.

Amanda Network Backup Bacula


• Desarrollado por Zmanda. • Software distribuido bajo licencia GNU GPL.
• Código Perl distribuido bajo licencia BSD. • Conjunto de aplicaciones para realizar copias de
• Permite, desde un servidor, la realización de copias de seguridad y restaurarlas en red.
backup y restauraciones en múltiples hosts. • Da la posibilidad de volcar las copias de seguridad en
• Permite la realización de copias de backup en múltiples distintos formatos (discos, cintas, SAN)
soportes (discos, cintas, SAN). • Responde a una arquitectura cliente / servidor.

97
Software de fuentes abiertas en la Administración electrónica

7.2. Mapeo funcionalidad – componente

En esta sección, se presenta un listado de la funciona- Esta correspondencia se marca a través de los siguien-
lidad requerida al sistema de Archivo Electrónico de las tes iconos:
AAPP agrupada por módulos. El componente cubre la totalidad de la funciona-
lidad.
Sobre este listado, se establece la correspondencia El componente cubre la funcionalidad parcialmen-
con los componentes open-sources identificados para te.
su implantación. La columna marcada como core re- El componente no proporciona la funcionalidad
presenta la aplicación de repositorio digital que servirá señalada y se requerirá un desarrollo ad-hoc, bien
de núcleo al sistema (en el diseño se ha optado por Fe- para implantar dicha funcionalidad, bien para pro-
dora Commons). piciar la integración con otros componentes.

98
Archivo electrónico de las Administraciones Públicas

7.2.1. Módulo de pre-ingreso

Componentes
Funcionalidad Interfaz de usuario
Muradora Fez

Ingreso de objeto digital


Ingreso de mandatos
Relación entre paquetes
Categorización por directorios

99
Software de fuentes abiertas en la Administración electrónica

7.2.2. Módulo de ingreso

Componentes
Funcionalidad Core Validador de formato Extractor de MD Antivirus e-firma(*)
Jhove Droid VTLS NLNZ ClamAV

Validación formato
Validación virus
Validación firma de negocio
Validación catalogación
Extracción automática de metadatos
Sellado de tiempo
Creación paquete AIP
Generación PID

* Componente de firma
electrónica incluido en la
plataforma de Administración
Electrónica del organismo.

100
Archivo electrónico de las Administraciones Públicas

7.2.3. Módulo de almacenamiento

Componentes
Funcionalidad Core Gestor de backup
Amanda Bacula

Ingreso paquete AIP


Indexación paquete AIP
Conservación paquete AIP
Recuperación de AIP a partir de PID
Backup de paquete AIP

101
Software de fuentes abiertas en la Administración electrónica

7.2.4. Módulo de gestión de datos

Componentes
Funcionalidad Core Base de datos RDF
Mulgara

Registro de metadatos
Relación de Metadatos
Indexación de metadatos
Lanzamiento de consultas

102
Archivo electrónico de las Administraciones Públicas

7.2.5. Módulo de consulta y recuperación

Componentes
Funcionalidad Core Interfaz de usuario
Muradora Fez

Consulta por MD
Consulta por texto completo
Consulta por PID
Vista de resultados de búsqueda
Generación de paquetes DIP
Visualización de los contenidos

103
Software de fuentes abiertas en la Administración electrónica

7.2.6. Módulo de administración y configuración

Componentes
Funcionalidad Core Planificador de tareas Gestor LDAP Registro de Logs
Quartz Jcrontab OpenLDAP Apache Directory Log4J Java API
Gestión de usuarios
Control de accesos
Planificación de procesos
Transformaciones
Auditorías y monitorización

104
Archivo electrónico de las Administraciones Públicas

7.2.7. Módulo de preservación


Componentes
Funcionalidad Core Registros de formatos digitales
Pronom GDFR

Monitorización de la tecnología
Políticas de transformación
Políticas de emulación
Identificación de paquetes objetivo
Monitorización de certificados digitales
Políticas de resellado

105
Software de fuentes abiertas en la Administración electrónica

7.2.8. Módulo de gestión de transferencias


Componentes
Funcionalidad Core Gestores de workflow
Enhyndra Shark ObjectWeb Bonita

Identificación de paquetes a enviar


Relación de transferencia
Revisión en archivo destino
Aceptación de la transferencia
Transferencias de paquetes
Rechazo de la transferencia
Gestión de rechazos en origen

106
08.
Glosario
Archivo electrónico de las Administraciones Públicas

8. Glosario

AIP Exif (Exchangeable Image File Format)


(Archival Information Package) Especificación de formatos digitales usada
Unidad de almacenamiento del repositorio digital principalmente en cámaras fotográficas digitales.
definida por la norma OAIS. Se basa en la modificación de formatos de
archivo existentes como JPEG o TIFF, a los que se
AudioMD agregan etiquetas de metadatos.
(Audio Technical Metadata Extension Schema)
Esquema de metadatos utilizado para la GDFR (Global Digital Format Registry)
descripción de ficheros digitales de audio. Servicio soportado desde la Harvard University
Library para el almacenamiento, monitorización
DIP y evaluación de información de representación
(Dissemination Information Package) sobre archivos digitales.
La norma OAIS lo define como un
empaquetamiento de contenidos y metadatos IPTC
empleado para su distribución a los usuarios. (Internacional Press Telecommunications Council)
Hace referencia al estándar técnico de metadatos
Dublin Core promovido por esta organización para favorecer el
Esquema de metadatos elaborado por la DCMI intercambio de noticias.
para la descripción genérica de objetos digitales.
Define campos como título, autor, organización,
etc.
Considerado como el estándar de facto para
metadatos descriptivos.

109
Software de fuentes abiertas en la Administración electrónica

JSR-170 METS
(Content Repository for Java Technology API) (Metadata Encoding & Transmission Standard)
Especificación pública que define una API Estándar para la codificación de metadatos
Java estandarizada para el acceso a distintos descriptivos, administrativos y estructurales
repositorios de contenidos independientemente referentes a objetos almacenados en repositorios
de su tecnología. digitales.
Establece dos niveles de compatibilidad y algunas Se basa en la definición de una estructura XML.
funciones complementarias aparte de ellos:
Nivel 1: Navegación por el repositorio y lectura MIX
Nivel 2: Agregación de datos al repositorio (Metadata for Images in XML)
Complementos: entre otros versionado, bloqueo Esquema de metadatos para la definición de
de ficheros, consultas SQL. imágenes fijas promovido por la Librería del
Congreso americana.
LDAP
(Lightweight Directory Access Protocol) MODS
Protocolo estandarizado para el acceso a un (Metadata Object Description Schema)
servicio de directorio distribuido. Esquema de metadatos para la descripción
Permite la consulta de propiedades de los genérica de archivos digitales.
usuarios tales como identificador, contraseña, Actualmente es la alternativa más clara a Dublin
grupos a los que pertenece, etc. Core.

NLNZ
(Nation Library of New Zealand)
Organismo público impulsor de iniciativas para la
preservación de información electrónica.

110
Archivo electrónico de las Administraciones Públicas

OAI-PMH RDF
(Open Archives Iniciative - Protocol for Metadata (Resource Description Framework)
Harvesting) Framework para el intercambio de metadatos.
Framework de interoperabilidad, basado en Basado en el concepto de tripleta, cuyos
XML, para la compatición de información entre componentes son:
repositorios digitales. Recurso: cualquier entidad que pueda tener una
URI
OAIS Propiedad: característica normada del recurso
(Open Archival Information System) (metadato)
Modelo de referencia que define un sistema de Valor: valor asociado al metadato.
archivo electrónico orientado a la preservación de
la información digital. SIGEM
Está normalizado según la norma ISO 14721:2003. Plataforma de Administración Electrónica impulsada
por el Ministerio de Industria, Turismo y Consumo.
PREMIS Esta solución está a disposición de todas aquellas
(PREservation Metadata Implementation Administraciones Públicas que quieran implantarla.
Strategies)
Esquema de definición de metadatos orientados SIP
a la preservación de ficheros digitales durante (Submission Information Package)
largos periodos de tiempo. Paquete de ingreso en el repositorio digital de
acuerdo a la especificación OAIS

111
Software de fuentes abiertas en la Administración electrónica

SOA XACML
(Service Oriented Architecture) (eXtensible Access Control Markup Language)
Concepto de arquitectura software basada en el Lenguaje para la declaración de políticas de
uso de servicios para dar soporte a los requisitos control de accesos implementado sobre XML y
de negocio. modelo de procesado para la interpretación de
La publicación e invocación de estos servicios estas políticas
se realiza a través de procedimientos estándar, lo Se basa en dos componentes o entidades:
que facilita la integración entre distintos tipos de PEP (Policy Enforcement Point) – recibe las
sistemas, tanto propios como ajenos. peticiones sobre los recursos y da acceso en
función de la respuesta dada por el PDP.
TEI PDP: Policy Decision Point – evalúa las políticas
(Text Encoding Iniciative) de acceso definidas en el sistema y decide si el
Esquema de metadatos para la representación de PEP debe permitir que el solicitante acceda a la
textos en formato digital. información

WfMC XMP
(Workflow Management Coalition) (eXtensible Metadata Platform)
Modelo de referencia para favorecer la Contenedor XML de metadatos que puede
interoperabilidad entre sistemas de workflow incorporarse a un archivo digital.
Desarrollado por Adobe

112

You might also like