You are on page 1of 16

Artículos

Gestión de los documentos digitales:


estrategias para su conservación
Por Jordi Serra Serra

Resumen: La voluntad de conservar de forma permanente los documentos digitales ha estado


presente desde los primeros tiempos de la revolución informática. Sin embargo, han sido pocas las
experiencias de crear archivos digitales, debido principalmente a la dificultad para encontrar
soluciones técnicas a los problemas de obsolescencia, al alto coste económico y a la ausencia de
instituciones que asuman esta responsabilidad. Este artículo analiza las estrategias de
conservación aplicadas hasta el momento, y reflexiona sobre los planteamientos metodológicos que
han inspirado las mismas, las tendencias actuales y su viabilidad futura. A continuación expone las
dos opciones para identificar el documento digital y establecer sus límites, operación previa a la
aplicación de cualquier estrategia de conservación. Finalmente describe cómo se puede facilitar
esta identificación aplicando metodologías de evaluación y selección propias de la archivística, y
propone las reglas de evaluación documental como la herramienta fundamental que permite definir
una política de conservación de los documentos digitales.
Palabras clave: Documentos digitales, Archivos digitales, Preservación digital, Documentos
electrónicos, Evaluación y selección, Expurgo.

Title: Electronic records management: strategies for long term preservation


Abstract: The idea of long term preservation of electronic records has been present since the early
days of the computer revolution. However, there have been few documented experiences of creating
digital archives, mainly due to the difficulty of finding technical solutions to the problems of
obsolescence, high costs and a lack of institutions able to assume this responsibility. This paper
Jordi Serra Serra begins by analysing the preservation strategies applied to date and reflecting upon the
methodological underpinnings of these strategies, current trends and future viability. Next it
presents two options for identifying electronic records and defining their limits, a necessary step prior to applying any preservation strategy. Finally it
describes how archival appraisal can facilitate this identification process and proposes appraisal schedules as the main tools for defining an electronic
records preservation policy.
Keywords: Digital documents, Digital files, Digital archive, Digital preservation, Electronic records, Appraisal, Appraisal schedules.

Serra Serra, Jordi. “Gestión de los documentos digitales: estrategias para su conservación”. En: El profesional de la información, 2001, septiembre,
v. 10, n. 9, pp. 4-18.

Introducción ciente. Es paradigmático el hecho de que los autores de


El interés por el archivo de los documentos digita- la directriz europea sobre la firma electrónica tan sólo
les está creciendo a medida que se generaliza el e-busi- regularon su utilización, pero obviaron que los docu-
ness. El comercio electrónico es el hecho que hace más mentos firmados digitalmente requieren unos procedi-
evidente la necesidad de capturar y perpetuar las tran- mientos controlados de archivo cuando deben conser-
sacciones realizadas telemáticamente. ¿Qué sentido tie- var su valor legal durante todo el tiempo que la legisla-
ne garantizar la seguridad de una transacción electróni- ción estipula2. El Real decreto ley 14/19993, que desa-
ca y la autenticidad de sus intervinientes y de su conte- rrolla la directriz europea, tampoco recoge esta necesi-
nido, si esta información no puede ser utilizada como dad, con más gravedad por cuanto que desde la Ley
evidencia un tiempo después? La firma digital ha sido 30/1992 la conservación se considera una garantía del
la llave que ha hecho posible la expansión del comer- valor legal de los documentos digitales4.
cio electrónico, pero al mismo tiempo ha subido el lis-
tón de las dificultades para la conservación a largo pla- El objetivo de este artículo es comentar las dife-
zo de los documentos digitales1, un campo con un de- rentes tendencias dentro de las estrategias para la con-
sarrollo, tanto técnico como legislativo, todavía insufi- servación a largo plazo de los documentos digitales.

Artículo recibido el 01-07-01 Jordi Serra Serra. Facultat de Biblioteconomia i Documentació. Univ. de Barcelona.
Aceptación definitiva: 07-09-01 serra@fbd.ub.es

4 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

cords realizado entre 1994 y 1997 por la Uni-


versidad de British Columbia. Otra iniciativa a
destacar es el Cerar (Center for Electronic Re-
cordkeeping & Archival Research), que recoge
los trabajos de la Universidad de Pittsburgh
(Functional requirements for evidence in re-
cordkeeping), puestos en práctica en el Phila-
delphia electronic records project (Perp). En el
Reino Unido, el Public Record Office desarro-
Figura 1. El documento digital ha perdido la unidad física del documento lla desde 1995 el proyecto Eros (Electronic re-
tradicional
cords from office systems). El organismo Natio-
Iniciativas existentes nal Archives of Australia dispone de una sección dedi-
Son numerosos los proyectos internacionales que cada a los documentos digitales, que experimenta con
están estudiando los varios aspectos que condicionan su gestión y publica interesantes trabajos. También es
la conservación de los documentos digitales y de su importante el Dutch Digital Repository (Digiduur), un
valor evidencial. Sin ánimo de exhaustividad, destaca- proyecto holandés que tiene por objetivos adquirir ex-
mos en primer lugar el proyecto Interpares (Interna- periencia concreta en la preservación de los documen-
tional Research on Permanent Authentic Records in tos digitales y conseguir una toma de conciencia a ni-
Electronic Systems), compuesto por seis grupos de in- vel político.
vestigación de Canadá, USA, Norte de Europa, Italia,
Australia, y Este de Asia, y que tiene como base el es- Conceptos básicos
tudio The preservation of the integrity of electronic re-
La conservación de los documentos digitales pre-
senta una doble problemática5. En una primera fase es
Universidad de British Columbia necesario crear y mantener documentos activos y se-
Propone un modelo de actuación que tiene por miactivos fiables y auténticos. Esto significa preservar
objetivos: los valores primarios de los documentos, es decir el
—Establecer cómo reconocer e identificar un do- valor del documento como evidencia de un hecho a
cumento en el entorno digital. efectos de su utilización dentro de un procedimiento
—Determinar qué tipos de sistemas informáticos administrativo o proceso de negocio6. En una segunda
generan documentos. etapa se deben conservar los documentos inactivos au-
—Formular los criterios para segregar los docu- ténticos por sus valores secundarios, es decir por el va-
mentos del resto de conjuntos de datos generados lor intrínseco de la información que contienen7.
por los sistemas informáticos.
—Definir los requerimientos conceptuales para «¿Qué sentido tiene garantizar
garantizar la fiabilidad y la autenticidad de los docu- la fiabilidad de una transacción
mentos en los sistemas electrónicos.
electrónica y la autenticidad de
Este modelo parte de la definición de un docu-
mento tradicional completo (que tiene todas las par-
sus intervinientes y de su con-
tes: contenido, estructura y contexto administrativo y tenido si esta información no
documental), fiable (que su contenido es cierto) y au- puede ser utilizada como evi-
téntico (que es original, si ha sido transmitido de for- dencia un tiempo después?»
ma controlada y conservado y custodiado sin altera-
ciones). Esta definición se extrapola a lo que debe con- En el contexto de la preservación de los valores
siderarse un documento electrónico completo, fiable y primarios la problemática va asociada a la dificultad
auténtico, al que se añade un contexto tecnológico. El
para identificar el documento electrónico, y al estable-
modelo establece tres espacios de trabajo (individual,
de grupo y general o corporativo), y define los estados cimiento de sus límites y partes componentes (figura
del documento electrónico en relación con estos es- 1). El objetivo es conservar el documento como una
pacios. Un documento generado en el espacio indivi- entidad intelectual u objeto lógico, no como entidad fí-
dual es un borrador, y sólo se convierte en original sica8. En el entorno digital la mayoría de los métodos
cuando atraviesa una frontera electrónica. Es a partir de preservación de la integridad que se aplican (firma
de este momento cuando se debe controlar cualquier
digital, contraseñas, watermarks o filigranas, etc.) es-
modificación para que el documento se considere au-
téntico. tán basados en una concepción unitaria del documen-
to. Sin embargo los estándares de facto basados en

El profesional de la información, vol. 10, nº 9, septiembre 2001 5


Jordi Serra Serra

sgml, firmes candidatos a formatos de conservación a de legibilidad de un documento de uso cotidiano pue-
largo plazo, se basan en un modelo de documento de oscilar entre los 10-20 años en el aspecto de hard-
compuesto de diferentes documentos o partes de ellos, ware, y unos 5-10 años en el de software. Si este pla-
distribuido entre diferentes redes y sistemas informá- zo puede ser admisible para documentos con vigencia
ticos, y que puede ser actualizado con gran facilidad y limitada, no permite una planificación de la conserva-
sin dejar rastro (dinámico). Podemos tomar como ción a medio o a largo plazo, por lo que se imponen so-
ejemplo xml, en el que las hojas de estilo permiten al- luciones previas. Vamos a comentar con más detalle
macenar la estructura fuera del contenido del docu- cada una de estas soluciones.
mento, e incluso definir una estructura común a un
conjunto de contenidos. 1. Estrategias de conservación

En el ámbito de la conservación de los valores se- Podemos identificar cuatro métodos para garan-
cundarios, la preocupación principal es tanto la con- tizar la accesibilidad futura de los documentos digi-
servación física de los soportes como la legibilidad de tales9:
su contenido, un problema que afecta conjuntamente a
1.1. Preservación de la tecnología
la documentación administrativa y a la cognitiva. Por
esta razón los archivos y las bibliotecas nacionales es- La primera solución ha sido conservar la tecnolo-
tán trabajando en proyectos de conservación de los so- gía de la cual depende el documento. Para mantener el
portes y documentos digitales. Es muy interesante contexto tecnológico de accesibilidad de los documen-
consultar los numerosos trabajos publicados por el tos digitales es necesario “congelar” el estado de la
Council on Library and Information Resources (Clir) técnica en un momento determinado. Esto implica
y las actividades de la European Comission on Preser- conservar tanto el hardware como el software origina-
vation and Access (Ecpa), así como la obra: National les, y ocuparse de tenerlos en funcionamiento incluso
Preservation Office. Digital culture: maximising the cuando su obsolescencia sea ya completa, lo que en al-
nation’s investment. Mary Feeney (ed.). London: Bri- gunos casos ha conducido a la creación de verdaderos
tish Library Board, 1999. museos cibernéticos. Esta opción ha demostrado ser
http://www.clir.org económicamente inviable, y tan sólo es aplicable a
corto y medio plazo, o como una medida extrema
http://www.knaw.nl/ecpa/ecpatex/intro.htm
cuando se trate de una información de gran importan-
A medida que se ha asumido la independencia del cia y no sea posible migrarla a un nuevo entorno tec-
documento electrónico de sus distintos soportes físicos nológico actualizado.
ha disminuido la problemática de la conservación físi-
ca de los soportes puesto que, considerando que una 1.2. Migración de la información digital
copia en el entorno informático es siempre una copia Se ha impuesto como la solución más aceptada pa-
idéntica, un cambio de soporte físico no implica nin- ra la creación y el mantenimiento de archivos digitales.
guna transformación en el documento. Ciertamente si- Parte de la idea de que los documentos deben ser ac-
gue existiendo el reto de la conservación física de los cesibles a partir de los sistemas informáticos existentes
soportes digitales, pero su tratamiento no es el objeto en cada momento, lo que exige su migración periódi-
de este artículo, teniendo en cuenta que la duración de ca a formatos inteligibles por los sistemas actuales.
los soportes actuales, tanto ópticos como magneto-óp-
ticos, proporciona un margen de tiempo suficiente co- Existen diversas estrategias de migración, cada
mo para realizar un recopiado periódico (refreshing). una de ellas adaptada a un determinado tipo de docu-
mento digital.
«A medida que se ha asumido
la independencia del documen- —Cambio de medio. Esta estrategia pretende
to electrónico de sus distintos subsanar la obsolescencia física, y consiste en un reco-
soportes físicos, ha disminuido piado periódico de los documentos digitales a soportes
la problemática de la conserva- más estables (por ejemplo, de soporte magnético a óp-
ción física de los soportes» tico). En su forma más extrema incluye la impresión
en papel o la microfilmación de los documentos digi-
El problema de la legibilidad está asociado a la ob- tales con tal de conservar la accesibilidad o legibilidad
solescencia tecnológica, tanto de hardware como de del contenido, aun a costa de perder todas las funcio-
software. Como todos hemos experimentado, el plazo nalidades del documento digital original.

6 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

El método Constance
En 1978 los archivos nacionales a. Del sistema informático o —Las decisiones sobre la meto-
de Francia, a través del Centre des aplicación que genera el documento. dología y la financiación de un archi-
Archives Contemporaines, empezaron b. Del proceso administrativo. vo digital público deben ser tomadas
a trabajar en la conservación de los al más alto nivel de gobierno.
c. De la estructura del docu-
documentos digitales generados
mento. La principal aportación del pro-
por la Administración Central fran-
cesa. Esta actividad se concretó en d. Del contenido del documento. yecto Constance es la experiencia
1983 con la creación de un archivo e. Ficha técnica indicando el pe- obtenida en referencia a los costes
digital y de un conjunto de métodos so, número de registros, longitud, de mantenimiento de un archivo
de trabajo que recibió el nombre de etc. digital de gran envergadura. Con an-
Constance (Conservation et stockage f. Diccionario de datos (cuando terioridad al establecimiento de
des archives nouvelles constituées par se trata de una base de datos). unos estándares de conservación, la
l’électronique)10. El principal objetivo voluntad del Centre des Archives Con-
—Prueba del documento en su temporaines era conservar ejempla-
de este proyecto era la conserva- nuevo formato usando la descrip-
ción permanente de los docu- res de todos los programas y tipos
ción anterior. de ordenadores utilizados por la Ad-
mentos digitales con valor eviden-
—Fijación en un soporte defini- ministración Central francesa, y en
cial, mediante una evaluación previa
tivo y archivo seguro del documen- esta dirección dirigieron sus esfuer-
que eliminaba los documentos sin
to, con las correspondientes copias zos. El coste de mantenimiento de
interés histórico o con información
de seguridad. este archivo crecía de forma expo-
repetitiva.
La mayoría de los documentos nencial, y pronto adquirió dimensio-
Inicialmente se usó la cinta mag- nes prohibitivas para los fondos pú-
conservados son ficheros estadísti-
nética como medio de almacenaje, blicos que, coincidiendo con un re-
cos y censales o de gestión de per-
puesto que era el tipo de soporte de corte presupuestario (1993), condu-
sonal a partir de 1960. Los períodos
uso más extendido. Sin embargo las jeron a la Administración a reducir
de publicidad y las características del
condiciones de conservación eran la plantilla de 15 a 4 técnicos y a li-
acceso a los documentos archivados
exigentes y se hacía necesario un re- mitar los gastos en hardware. El pro-
son establecidos por la Commission
copiado periódico de las cintas (re- yecto, que hasta el momento había
Nationale pour l’Informatique et les Li-
freshing). Su anunciada obsolescencia sido impulsado por el Ministerio de
bertés. Sin embargo, dado que la ma-
obligó, a partir de 1995, a sustituir el Cultura, pasó a depender directa-
yoría de documentos conservados
soporte magnético por el soporte mente de los archivos nacionales, y
contienen datos personales que, se-
óptico, iniciándose un laborioso pro- se creó un grupo de trabajo intermi-
gún la legislación francesa, no pue-
ceso de migración, que finalizó en nisterial para su seguimiento. En la
den ser públicos hasta pasados 100
199711. Esta operación se realizó con actualidad, sin embargo, el coste del
años, la difusión de los documentos
la previsión de unos diez años de re- archivo todavía es financiado ínte-
se ha limitado hasta el momento a
lativa estabilidad, tras los cuales se- gramente por el Ministerio de Cultura.
los usuarios internos de la propia
ría necesario iniciar una nueva mi- El archivo se ha tenido que adaptar a
Administración. Paradójicamente es
gración. Pero en 1998 se vio que la la nueva situación, trabajando sólo
muy difícil justificar la inversión rea-
opción escogida había sido un error con formatos de bajo nivel. Pero in-
lizada en un archivo histórico cuan-
estratégico, y fue necesario volver a cluso con estas limitaciones el man-
do existen tales restricciones a la di-
migrar toda la documentación a cin- tenimiento de este archivo sigue
fusión de su contenido.
tas magnéticas DLT 4000. siendo muy caro, y la cantidad nece-
Las conclusiones del proyecto
Un punto importante para el Constance son las siguientes: saria de personal altamente cualifica-
mantenimiento de un archivo digital do muy elevada.
—Los costes de mantenimiento
es la regulación del proceso de
de un archivo digital son imprevisi- Existe otro factor que aumenta
transferencia de documentos. Ac-
bles, puesto que dependen de fac- los costes: mientras en un archivo
tualmente la operativa del método
tores externos al archivo, tanto de la administrativo los fondos documen-
Constance es la siguiente:
evolución tecnológica como de la tales pueden mantener estables sus
—Selección de los documentos estructura de las organizaciones que dimensiones gracias al expurgo, en
a conservar en las misma oficinas producen los documentos. un archivo histórico los fondos cre-
productoras, con el asesoramiento —La principal inversión para el cen constantemente. Por esta razón,
directo de miembros del equipo mantenimiento de un archivo digital considerando que aproximadamente
Constance. debe realizarse en la formación de cada diez años será necesario migrar
—Tratamiento de los documen- los recursos humanos, puesto todo el fondo documental a nuevos
tos transferidos, migrándolos a un que los problemas tecnológicos se- soportes y formatos, el volumen de
formato estándar (preferentemente rán cambiantes y su resolución de- documentos para cada migración se-
ascii) y elaborando los siguientes penderá de las habilidades del per- rá mucho mayor y sus costes mucho
elementos descriptivos12: sonal del archivo. más elevados.

El profesional de la información, vol. 10, nº 9, septiembre 2001 7


Jordi Serra Serra

Center for Electronic Records13


Es un organismo dependiente de ferencia al soporte, admite tanto las tablas de datos y la documenta-
la Nara que tiene como misión ga- cintas magnéticas como cd-rom, y ción de las relaciones, y respetando
rantizar el acceso a los documentos establece las normas de grabación la primera forma normal. En princi-
digitales de conservación permanen- de los datos, pero no contempla la pio no se contempla la transferencia
te generados por las oficinas del Go- transferencia telemática realizada di- de bases de datos no relacionales.
bierno Federal de los Estados Unidos. rectamente a los servidores del Cen-
Este archivo digital constituye una ter. Estas normas especifican que los Cuando se recibe una transfe-
vasta fuente de información, al mis- soportes transferidos pueden conte- rencia electrónica es necesario un
mo tiempo que sirve de evidencia y ner ficheros de software y de datos proceso de validación antes de in-
testimonio de cómo las oficinas del en un mismo soporte, pero que los corporar los documentos al archivo
Gobierno Federal han llevado a cabo documentos que se consideren his- digital. La validación es el proceso de
su acción política y administrativa. El tóricos deben estar en un soporte
comparar el contenido de los docu-
centro recoge todo tipo de docu- que contenga únicamente ficheros
mentos digitales recibidos de una
mentos generados directamente en de conservación permanente.
agencia federal con la descripción
formato digital, tales como bases de En referencia al formato, los
datos, documentos de texto o siste- del contenido de estos documentos
documentos transferidos deben es- que proporciona la documentación
mas de información geográfica. Los tar en un formato no dependiente
documentos digitales conservados que los acompaña15. Inicialmente la
de un hardware o software concre-
por la Nara constituyen asimismo un Nara realizaba una validación ma-
tos. El documento debe estar codifi-
testimonio de la evolución de la tec- nual, imprimiendo una parte de los
cado en ascii o ebcdic, habiendo eli-
nología informática. Los más anti- datos y comparando su estructura
minado de él todos los caracteres de
guos datan de la Segunda Guerra control, a excepción de los delimita- con la expresada en la documenta-
Mundial, aunque la mayor parte de dores de campo y registro y de las ción. Desde 1992 se utiliza la aplica-
los documentos son posteriores a etiquetas sgml. El fichero no puede ción informática Aeric (Archival elec-
1960. tener ningún tipo de compresión tronic records inspection and control),
El Center for Electronic Records ha que no haya sido aprobado previa- desarrollada en Oracle, que analiza y
establecido unas normas para la mente por la Nara. Los ficheros de depura las tablas de datos, generan-
transferencia de documentos elec- base de datos se deben transferir en do un informe con las anomalías que
trónicos a su archivo digital por par- ascii, sql o irds14, desvinculados de la deben ser solventadas antes de su
te de las oficinas federales. En re- tecnología original, únicamente con ingreso en el archivo digital.

—Compatibilidad retroactiva. Los programas —Conversión a formatos estándar. Podemos


comerciales permiten a menudo leer documentos crea- considerar esta opción una versión extendida de la in-
dos con versiones anteriores de una misma familia de teroperabilidad.
programas, así como su migración a la versión actual. La existencia de formatos estándar es la principal
La compatibilidad retroactiva, sin embargo, está suje- garantía de la conservación de la funcionalidad de los
ta a los cambios en la estrategia comercial de la em- documentos digitales. Sin embargo, los formatos es-
presa productora del software. Además, este tipo de tándar válidos como formato final para la conserva-
migración puede realizar alteraciones en la estructura ción permanente no siempre pueden ser un formato de
interna de los documentos digitales no deseables des- trabajo, como sucede por ejemplo en la edición de do-
de el punto de vista legal, o que atenten a la autentici- cumentos con sgml o xml. Esta estrategia, por lo tan-
dad del documento original. to, debe contemplar la utilización de un formato segu-
ro (fiable y auténtico) durante el uso del documento,
—Interoperabilidad. Programas de distintas em- cuando tiene valores primarios, e incluir la posibilidad,
presas pueden compartir los mismos formatos de do- cuando se quiera disponer el documento para su con-
cumento digital. Esta estrategia comercial, practicada
por los principales productores de software, permite
visualizar documentos de un formato propietario con
el programa de otra empresa y convertirlos a nuevos
formatos propietarios. En este caso se reproducen los
mismos problemas que en la compatibilidad retroacti-
va: la dependencia de las políticas de empresa, y el ele-
Figura 2. Un documento digital encapsulado
vado porcentaje de pérdida de datos.

8 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

Teoría de la emulación
El uso de emuladores para la metadatos sobre el documento, su —Anotación: crear las explica-
conservación permanente de los do- ciclo de vida y su contexto de crea- ciones sobre el contexto del docu-
cumentos digitales ha sido propues- ción, anotaciones, etc. Consiste en mento y sobre cómo abrir y usar la
to por Jeff Rothenberg16. Esta teo- un fichero readme, que contiene las encapsulación.
ría parte de que la única forma de instrucciones para el proceso de —Encapsulación: construir la
poder recrear la apariencia y la fun- abrir y poner en marcha un docu- estructura lógica que contenga to-
cionalidad originales de un docu- mento encapsulado. dos los elementos citados.
mento digital es mediante el softwa- —El emulador de la plataforma —Transliteración: periódica-
re con el que fue creado. La pro- informática original. No consiste en mente actualizar las anotaciones o
puesta consiste en utilizar aplicacio- un programa ejecutable, sino en la explicaciones textuales para mante-
nes que emulen el funcionamiento especificación de los atributos tec- nerlas inteligibles.
de los programas originales cuando nológicos considerados relevantes
éstos sean ya obsoletos. —Emulación: cuando sea ne-
para recrear el comportamiento del
cesario acceder al documento se de-
Sin embargo no tendría sentido documento original.
berá abrir la encapsulación, crear el
conservar emuladores de cada soft- —El documento y su entorno emulador específico, y hacerlo fun-
ware utilizado, puesto que con el de software. Consiste en el docu- cionar en el ordenador futuro. Ob-
tiempo estos emuladores también mento digital, compuesto de uno o viamente no será necesario crear un
serían obsoletos. Lo que se debe más ficheros en el formato original, emulador para cada documento, tan
conservar asociado al documento es más los ficheros que representan la sólo para cada tipo o formato de do-
la información sobre cómo de- cadena de bits ejecutable original cumento.
sarrollar un emulador que pueda que permitía reproducir el docu-
reproducir ese documento. Esta fór- Para desarrollar este modelo se-
mento, y los ficheros que represen-
mula debe ser suficientemente rá necesario investigar en el desa-
tan la cadena de bits del sistema
abierta para sobrevivir a la incerti- rrollo de un metalenguaje que sirva
operativo que permitía que se ejecu-
dumbre tecnológica de la conserva- para describir las especificaciones
tase el software.
ción indefinida. del emulador con relación a una pla-
En la práctica los elementos co- taforma de hardware concreta, así
La propuesta consiste en en- munes a más de un documento pue- como de técnicas para hacer siem-
capsular tres tipos de información den ser almacenados de forma cen- pre inteligibles las explicaciones y los
con cada documento digital (figura tralizada, encapsulando con el docu- metadatos, y de métodos de encap-
2)17: mento tan sólo un enlace al elemen- sulación que protejan la información
—La explicación en un formato to correspondiente18. digital de posibles manipulaciones o
permanentemente inteligible del El proceso completo compren- del deterioro y que aseguren su co-
software y del hardware emulado, de cuatro etapas: hesión19.

Universal preservation format (UPF)20


La Wgbh Educational Foundation, Computer y conocido también como rentes variantes de Unix.
con una subvención de la National OpenDoc standard interchange format. El formato de intercambio Open
Historical Publications and Records Un contenedor Bento es un tipo de media framework (OMF)22, de Avid
Commission, ha impulsado el desa- fichero que contiene uno o más ob- Technology, actualmente un estándar
rrollo de un formato universal de jetos, junto con la información sobre para el intercambio de documentos
preservación a largo plazo de los do- estos objetos (metadatos). Dicho digitales entre plataformas heterogé-
cumentos digitales que asegure la contenedor permite reproducir e in- neas, ha adoptado el uso de conte-
accesibilidad de un amplio abanico tercambiar documentos entre dife- nedores Bento. OMF encapsula toda
de formatos con independencia de rentes plataformas, aunque los obje- la información necesaria para la edi-
cualquier plataforma. tos que contiene no correspondan a ción y la reproducción de los docu-
La idea del formato universal de un mismo formato propietario ni ha- mentos digitales que contiene.
preservación es la de un contenedor yan sido diseñados para utilizar los Aunque no se consiga un único
en el que no sólo se almacenan los mecanismos Bento. Los objetos pue- formato estándar de preservación,
documentos digitales, sino también den ser simples o complejos, y pue- el uso de estos contenedores com-
toda la información necesaria para den pesar desde unos pocos bytes patibles con una gran variedad de
poderlos reproducir. Esta idea la en- hasta 264 bytes. Actualmente el có- formatos reduce notablemente la di-
contramos desarrollada en el Bento digo Bento funciona sobre Macintosh, versidad de los documentos que es
container format21, creado por Apple DOS, Microsoft Windows, OS/2 y dife- necesario conservar.

El profesional de la información, vol. 10, nº 9, septiembre 2001 9


Jordi Serra Serra

datos estructurados de bases de datos relacionales), pe-

Migración: compatibilidad retroactiva


ro puede ser aplicable a documentos más complejos

Migración: conversión a estándar


siempre que éstos estén sujetos a normas abiertas y se

Migración: cambio de medio

Migración: interoperabilidad
disponga de las herramientas adecuadas para su mi-
gración al formato estándar con la menor pérdida de
datos posible.

Tabla 1 1.4. Emulación de la tecnología

Emulación
El objetivo de este método es conservar la funcio-
nalidad que tienen los documentos cuando son repro-
Conjuntos de datos X
ducidos por el software original. Esta emulación se
Texto estructurado X
Documentos ofimáticos X X X puede limitar a conservar la presentación visual de los
Gráficos de datos X X X X documentos mediante visores (viewers) o bien conser-
Presentaciones X X X vando la imagen electrónica del documento, con for-
Imágenes X X X matos como pdf o djvu. Pero se puede avanzar hacia
Sonido X X X
Vídeo X X X
una opción más completa, intentando conservar una
Datos geográficos y mapas X X X versión reducida del software operacional y los siste-
Publicaciones multimedia interactivas X mas originales, o bien desarrollando un emulador que
servación a largo plazo, de congelar sus valores pri- reproduzca el funcionamiento de dichos sistemas ori-
marios en un formato estándar. ginales. Esta opción garantiza la autenticidad de los
documentos conservados y la fidelidad de la reproduc-
A pesar de ser el método más aceptado, la migra- ción, pero al mismo tiempo presenta un importante in-
ción presenta numerosos problemas. Migrar la docu- conveniente: tanto la versión reducida del software
mentación de un archivo digital es caro —en recursos original como el emulador también están sujetos a una
materiales y humanos—, laborioso y lento. También es progresiva obsolescencia, y su mantenimiento y actua-
una tarea peligrosa que comporta un riesgo de pérdida lización pueden ser muy difíciles, especialmente cuan-
de datos, tanto por errores en la grabación como por do dependan de una firma comercial que actúe exclu-
incompatibilidades entre formatos. Hay que añadir que sivamente en función de los intereses del mercado.
el curso de la tecnología y su ritmo de obsolescencia
son imprevisibles, por lo que cada nueva migración Cada tipo de documento digital tiene unas caracte-
presenta una problemática distinta. rísticas específicas de conservación y, sobre todo, unas
necesidades de utilización por parte de la organización
1.3. Eliminación de la dependencia de los docu-
productora, que son establecidas durante su evalua-
mentos de una determinada tecnología
ción23. Por esta razón la política de preservación de un
Este método consiste en eliminar las dependencias archivo digital no debe basarse tan sólo en una de las
no esenciales que los documentos mantienen con los estrategias citadas. En la tabla 1 se indican los méto-
programas con que han sido creados. Estas dependen- dos más adecuados para aplicar a cada tipo de docu-
cias pueden ser de dos tipos: mento digital24.
—Funcionalidades para editar o actualizar el do- 2. Objetos versus procesos
cumento electrónico (por ejemplo, el sistema gestor de
una base de datos, sgbd). Cuando se plantea la conser- Hasta este momento hemos analizado la problemá-
vación a largo plazo de un documento digital auténti- tica de la conservación a largo plazo de los documen-
co se infiere que debe ser inmodificable. Por lo tanto, tos digitales considerándolos unidades mínimamente
no es necesario conservar más que las funcionalidades identificables e independientes. Ya hemos comentado
de visualización y los datos contextuales. que esta no es, en la mayoría de los casos, la naturale-
za real de los documentos digitales. Su carácter com-
—Vestigios de la tecnología original, como por
puesto, distribuido y dinámico proviene de la relación
ejemplo los formularios y listados de una base de datos.
que mantienen con los sistemas informáticos que los
Esta opción necesita una tecnología estándar para generan, los cuales a su vez están inextricablemente li-
la recuperación de la información, una vez eliminada gados a los procesos operativos de una organización.
su dependencia original. Hasta el momento se ha utili- En este horizonte metodológico se plantea si la con-
zado en documentos digitales simples (texto plano o servación debe orientarse al documento como enti-

10 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

Figura 3

dad unitaria, o si debe seguir un enfoque orientado a sino del sistema gestor de la bdd que se utilice. Cuan-
procesos. Vamos a trabajar algunos ejemplos. do nos planteamos la conservación a largo plazo de los
contenidos de una bdd, debemos ser capaces de identi-
«En el contexto de la preserva- ficar sobre qué partes de la misma se deben aplicar las
ción de los valores primarios, estrategias de preservación. El usuario que trabaja con
la problemática va asociada a ella accede a los datos mediante un conjunto de for-
la dificultad para identificar el mularios e informes, y lo hace de manera que la forma
documento electrónico, y para como se estructuran los datos en una interfaz de entra-
establecer sus límites y partes da o de salida no se corresponde con la estructura in-
componentes» terna de las tablas, sino con las necesidades del usua-
rio. Por ejemplo, una base de datos que gestiona la for-
El caso paradigmático de este dilema son las bases mación del personal de una empresa le sirve al usuario
de datos (bdds), las cuales se pueden concebir como
para generar los certificados para los alumnos que han
documentos en su conjunto, o únicamente como herra-
asistido a los cursos. En último término, al usuario lo
mientas generadoras de documentos25. Tomemos el
que más le interesa es el conjunto de datos que consti-
ejemplo de una base de datos relacional típica, que en-
tuye el certificado de asistencia, documento identifica-
tendemos como un conjunto de datos estructurados en
una o más tablas que mantienen entre sí relaciones de ble y al cual podemos atribuir valores administrativos
distinto grado, formando un núcleo compuesto por el y jurídicos. Los datos de este certificado provienen de
contenido (datos) y la estructura (tablas y relaciones). las tablas de alumnos y de cursos, y de la relación
Estos datos se actualizan mediante diversas interfaces “muchos a muchos” cursos realizados por cada alum-
de usuario (formularios), y su explotación se realiza a no. Sin embargo, al usuario no le interesa conservar
través de un conjunto de consultas o vistas y formatos sólo una de estas tablas. Lo que necesita es poder re-
de salida (informes). La actualización y la explotación producir siempre que sea necesario el agregado de da-
de los datos no dependen de éstos ni de su estructura, tos que constituye el certificado. Ante esta situación es

El profesional de la información, vol. 10, nº 9, septiembre 2001 11


Jordi Serra Serra

Figura 4

cuando se pueden adoptar dos estrategias distintas (fi- El mismo razonamiento podemos hacerlo extensi-
gura 3). ble a todos los sistemas de gestión de documentos:
Aunque un sistema workflow trabaje orientado a docu-
mentos ¿no es la información de los procesos en su
«El problema de la conserva-
conjunto lo que realmente refleja el funcionamiento de
ción de los documentos elec-
la organización? ¿en qué medida un data warehouse
trónicos reside tanto en la di- puede identificarse, por su carácter exhaustivo y acu-
versidad de soluciones tecno- mulativo, con el archivo histórico de una organización?
lógicas como en la falta de co-
hesión de las soluciones meto- Los mismos parámetros podemos aplicar al correo
dológicas que se aplican» electrónico. Los mensajes y su contexto residen den-
tro del sistema de mensajería, pero dicho sistema no
Si nos referimos a una estrategia orientada a docu- puede garantizar su conservación ni funcionar a modo
mentos, el usuario se conformará con poder convertir de archivo digital, puesto que la mayoría de programas
el certificado que tiene en pantalla en un documento de correo electrónico están diseñados para un corto pe-
digital completo, extrayéndolo de la base de datos y ar- ríodo de conservación de los mensajes en los buzones
chivándolo junto con su contexto de creación median- digitales. Por lo tanto, los mensajes deben transferirse
te un proceso controlado y autenticado. Podría, por al sistema de gestión documental corporativo (edms),
ejemplo, convertir el certificado en un documento pdf, una vez seleccionados aquellos que tengan valor evi-
con sus correspondientes metadatos, y con algún tipo dencial26.
de certificación digital. Si optamos por una estrategia Como veremos más adelante, la evaluación es cla-
orientada a procesos, será toda la base de datos que au- ve para escoger la mejor política de preservación del
tomatiza el proceso de gestionar cursos la que deberá correo electrónico. En Estados Unidos, cuando el pre-
ser conservada, tomando la prevención de que su es- sidente abandona su cargo, todos los mensajes de co-
tructura responda a la necesidad de poder “recrear” el rreo electrónico se transfieren en bloque para su con-
certificado, es decir, protegiendo y fijando los datos servación permanente, puesto que toda la correspon-
necesarios a partir del momento en que adquieren ca- dencia de la Casa Blanca se considera un documento
rácter “histórico”. Esta decisión se debe tomar en la fa- histórico. En cambio la mayoría de las organizaciones
se de análisis y diseño de la base de datos. deben adoptar una estricta política de selección que

12 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

permita que los mensajes que se consideran documen- del archivo a largo plazo de las páginas web, del que
tos evidenciales sean transferidos a un sistema seguro en otras ocasiones se ha tratado ya29. Desde la utópica
de conservación junto con su contexto de transmisión propuesta de Brewster Kahle30 hasta los enfoques más
(registros de fechas, ficheros adjuntos o attachments, realistas del proyecto Pandora31 se ha planteado cuáles
etc.), considerando el sistema de correo electrónico tan son los elementos de una página web que forman par-
sólo un instrumento para realizar las transacciones te- te de una misma unidad documental y que en conjun-
lemáticas. La Universidad de California incluye los
to pueden reunir el valor evidencial que justifique su
mensajes de correo electrónico en sus reglas de eva-
conservación32. Las organizaciones deben saber qué ha
luación de conservación (records disposition schedu-
estado disponible, para quién y en qué momento. Step-
les), y transfiere los mensajes con valor evidencial a
hen Harries define las dos perspectivas para archivar
formatos más estables para su conservación perma-
nente27. las páginas web:

Las administraciones públicas y las empresas utili- —Modelo documento (u orientado a objetos): una
zan cada vez más internet en sus relaciones con sus página web contiene elementos que pueden conside-
usuarios o clientes, así como intranets para el inter- rarse documentos de archivo. En este caso es preciso
cambio de información dentro de la organización28. Es- evaluar toda la página para seleccionar estos elemen-
tos desarrollos tienen un gran impacto en la necesidad tos, que se integraran en el edms corporativo y serán

Estrategia orientada a objetos

El National Partnership for Ad- ciados a la misma. Teniendo en donde se conservan los docu-
vanced Computational Infrastructu- cuenta que desde el punto de vis- mentos y se realiza virtualmente
re, con sede en el San Diego Su- ta archivístico no se deben cap- el trabajo archivístico, y un con-
percomputer Center (Sdsc) está turar solamente los documentos junto de herramientas utilizadas
desarrollando una parte del pro- sino también las relaciones entre para acceder a los documentos.
yecto Distributed object computa- los documentos de un mismo Durante el proceso de trans-
tion testbed (Doct) de infraestruc- fondo, la herencia de las propie- ferencia al archivo digital, la co-
tura de redes de alta velocidad. dades y la jerarquía de clases y lección o serie se descompone
La Nara colabora con el Sdsc en subclases se adecua sin proble- en todos los documentos que
el desarrollo de un modelo de mas a la estructura de un fondo contiene, y el contexto y la es-
preservación de los documentos documental. tructura de cada documento son
electrónicos, centrándose en la El primer paso en esta estra- caracterizados mediante metada-
conservación y el acceso de tegia consiste en identificar qué tos. Hasta el momento se ha uti-
acuerdo con los estándares ar- propiedades tiene cada objeto, y lizado xml para agregar los meta-
chivísticos35. cuáles de éstas se heredarán pa- datos a los objetos, creando una
La metodología orientada a ra cada clase. Y en segundo lugar, document type definition (dtd) para
objetos se basa en asignar una se deben aplicar las soluciones cada clase de objeto identificada
serie de propiedades (atributos y siempre a partir del nivel jerár- durante esta descomposición.
comportamientos)36 a cada obje- quicamente superior. Por ejem- Con esta operación la clase se
to de un conjunto, y relacionar- plo, los metadatos sobre el perí- convierte en un nuevo objeto, la
los a partir de una determinada odo de conservación de un do- dtd.
propiedad. De esta manera habrá cumento digital deben estar in- Las colecciones de objetos,
tantas clasificaciones posibles co- cluidos a nivel de clase. Todos los encapsuladas en formato xml,
mo atributos comunes compar- objetos relacionados con dicha son notablemente independien-
tan un determinado grupo de ob- clase heredarán esta informa- tes de la infraestructura informá-
jetos. Estas clasificaciones o cla- ción, que determinará su com- tica utilizada. El uso de xml sobre
ses son a su vez objetos, con sus portamiento cuando se apliquen una gran variedad de tipos de do-
propiedades, que se agrupan en automáticamente métodos de cumentos digitales produce una
metaclases. Todos los objetos selección y eliminación sobre un colección de objetos muy homo-
que pertenecen a una clase he- conjunto documental (figura 4). génea de cara a la conservación a
redan automáticamente los atri- El sistema incluye dos com- largo plazo, facilitando procesos
butos y comportamientos aso- ponentes: un depósito digital, de migración o emulación.

El profesional de la información, vol. 10, nº 9, septiembre 2001 13


Jordi Serra Serra

gestionados conjuntamente con el resto de documentos —Soportar una conservación a largo plazo, es de-
digitales. cir que sean accesibles, que se puedan visualizar en su
forma original y que incluyan su contexto de creación.
—Modelo base de datos (u orientado a procesos):
toda la página web es un documento de archivo. En es- —Servir de evidencia para saber quién creó el do-
te caso es preciso almacenar periódicamente una espe- cumento, cuándo lo hizo, y que el documento no ha si-
cie de “fotografía” digital de la sede web, fijando su do modificado desde ese momento, es decir que está
contenido en un momento dado y almacenándolo en íntegro.
un depósito digital, o en un sistema que permita un
control de versiones. Aun así, la funcionalidad de mu- —Si el documento está evaluado, saber cuándo se
chos elementos de la página web —así como la vigen- debe transferir o destruir y ejecutar dicho proceso.
cia de los enlaces— es muy difícil de capturar, por lo
—Debe ser posible aumentar o cambiar la infor-
que en la fase de evaluación hay que establecer:
mación asociada a un documento sin alterar de ningu-
a. Los límites del documento, es decir hasta dón- na manera su valor evidencial ni su integridad. Para
de hay que seguir los enlaces, qué elementos externos cumplir con este requerimiento, en el aspecto estructu-
forman parte del documento y qué elementos multi- ral los documentos digitales deben ser autodocumen-
media deben archivarse conjuntamente. tados (que sea posible reconstruir el contexto de crea-
ción a partir del mismo documento, sin necesidad de
b. El contexto del documento. Se debe crear un disponer del sistema que lo creó), autocontenidos (de
registro (log) del contexto de creación y utilización de manera que toda la información sobre el documento
la página web. Estos registros también forman parte, esté contenida en el mismo documento) y extensibles
conceptualmente, del mismo documento. (de forma que se pueda ampliar la estructura del docu-
mento para añadir nuevos metadatos o enlaces sin
c. La estructura y la presentación. En las bases
afectar su estructura básica).
de datos dinámicas es necesario conservar también los
datos de origen, o las sucesivas presentaciones de es-
«La herramienta conceptual
tos datos.
que se convierte en la clave
Si el mantenimiento de una página web está cen- para la preservación de los do-
tralizado y depende del filtro de un webmaster es más cumentos electrónicos son las
fácil preparar los contenidos para su conservación a reglas de evaluación docu-
largo plazo que si todos los usuarios tienen la posibili- mental»
dad de publicar directamente en internet o en la intra-
net. La actuación sobre las fuentes de información es Es interesante remarcar la extensibilidad como
siempre más efectiva que la captura de los contenidos característica de la conservación orientada a documen-
una vez publicados. Así, el webmaster puede extraer tos. Cuando un documento digital es firmado digital-
periódicamente una copia de archivo de cada página mente o enviado por correo electrónico se convierte en
publicada, y mantener un registro histórico del mapa un original, en un documento definitivo y auténtico
de la sede web y de los enlaces33. Existen en el merca- con valores primarios. Pero aquí no finaliza su utiliza-
do programas que facilitan la automatización de esta ción. El documento puede pasar por trámites o valida-
tarea, incluso en entornos descentralizados donde to- ciones que le añadan información, marcas de autenti-
dos los usuarios pueden publicar directamente los do- cación, control de versiones, o referencias a otros do-
cumentos. cumentos posteriores (por ejemplo durante su tramita-
ción dentro de un sistema workflow o con herramien-
Entre las dos estrategias reseñadas, actualmente se tas groupware). Asimismo, el entorno tecnológico del
impone la tendencia orientada a documentos (véase documento cambiará, y el documento tiene que ser
xml), cada vez más autosuficientes, independientes de compatible con los nuevos sistemas sin perder sus ca-
un software concreto, que podrán ser modificados y racterísticas primigenias. Por esta razón la Vers define
visualizados por distintos programas a lo largo de su dos partes en un documento digital:
ciclo de vida. La Victorian electronic records strategy
(Vers)34, Australia, se decanta por esta opción. Según —Una parte invariable o contenido, que es aque-
ella, todos los documentos digitales deben estar un for- lla que debe ser conservada en su codificación y es-
mato que permita: tructura originales (pdf, xml, etc.).

14 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

—Una parte variable o contexto, que acumula to-


dos los metadatos que describen la estructura, el con- El modelo finlandés aplicado a la evalua-
tenido, el contexto documental o las relaciones con ción de los documentos electrónicos
otros documentos, y las características técnicas y de El modelo finlandés de gestión documental se
reproducción o visualización. ha caracterizado siempre por su pragmatismo en
la búsqueda de soluciones. Según este modelo42,
3. La importancia de la evaluación
las reglas de evaluación (records management sche-
Todas estas propuestas eminentemente tecnológi- dules en este caso) deben incluir cierta informa-
cas exigen una actuación previa en la fase de creación ción básica sobre los sistemas informáticos que
de los documentos. Con el fin de preservar sus valores generan los documentos, como por ejemplo:
primarios el documento debe ser creado de forma —Funciones básicas del sistema.
controlada, de manera que el sistema garantice su fia- —Si la información en el sistema está clasifi-
bilidad y su autenticidad (recordemos que el sistema cada o no.
informático es parte del contexto que da sentido al do- —Información técnica (software, hardware).
cumento). Pero también debe ser creado en el forma- —Personas responsables de la información y
to que mejor responda a su futura disposición, sea del mantenimiento técnico del sistema.
esta la conservación o la destrucción. De este modo, la Desde 1994 en los Archivos Nacionales de Fin-
herramienta conceptual que se convierte en la clave landia un grupo de trabajo estudia los materiales
para la preservación de los documentos electrónicos digitales y propone métodos para su tratamiento.
son las reglas de evaluación documental (appraisal Una aportación interesante es la distinción entre
schedules)37. conservación permanente y conservación conti-
nua. Los documentos de conservación perma-
Estas reglas no corresponden al modelo tradicional nente son aquellos que se conservan por su va-
de expurgo (la selección realizada sobre conjuntos de lor histórico, y deben permanecer inalterables,
documentos preexistentes), sino a la evaluación por mientras que los documentos de conservación
funciones, que parte del análisis del contexto general continua son aquellos que se conservan por sus
de la organización (macroevaluación) para llegar al valores primarios y deben permanecer siempre
detalle en cada función o proceso (microevaluación). accesibles. Esta distinción debe ponerse en rela-
Estas reglas no se limitan a un calendario de conserva- ción con las dos necesidades especificadas por el
ción, sino que especifican el formato de creación y uti- proyecto de la Universidad de British Columbia,
lización del documento acorde con su período de con- cuando distingue entre unas necesidades prima-
servación. Asimismo establecen su contenido informa- rias de integridad y unas necesidades secundarias
tivo en función de su participación en un determinado de conservación.
proceso, su régimen de acceso y sus sistemas de au-
tenticación, permitiendo así calcular los costes de la
mente ligado a proyectos de reingeniería de procesos
conservación de los documentos digitales. En definiti-
(bpr), e incluso el proyecto de la Universidad de Bri-
va, las reglas de evaluación proporcionan toda la in-
tish Columbia establece que para garantizar la correc-
formación que se debe introducir en el sistema infor-
ta gestión y preservación de los documentos electróni-
mático de una empresa o institución para que su ges-
cos es necesario integrar los procedimientos documen-
tión documental sea verdaderamente eficaz.
tales con el resto de procedimientos de la empresa. Así
La localización física de los documentos informá- se ha puesto en marcha en el estado de Kentucky
ticos es aleatoria, de modo que la clasificación es la (EUA), donde el programa para impulsar las transac-
única forma de relacionar archivísticamente dichos do- ciones electrónicas entre las empresas y unificar los
cumentos. Los documentos virtuales (compuestos, dis- servicios de las oficinas públicas (Enterprise informa-
tribuidos y dinámicos) no pueden ser conservados co- tion technology strategic plan) incorpora el requeri-
mo tales más que a partir de la clasificación, que per- miento de que una vez rediseñados los procesos se ela-
mite relacionar intelectualmente las distintas partes del boren las herramientas conceptuales básicas del siste-
documento. Las reglas de evaluación parten pues de ma de gestión documental antes de proceder a la in-
una herramienta previa, el cuadro de clasificación, formatización.
que permite identificar y referenciar todos los procesos
de una empresa o institución susceptibles de ser docu- David Bearman39 expone cuatro principios para la
mentados38. El diseño de esta herramienta va íntima- evaluación de los documentos digitales:

El profesional de la información, vol. 10, nº 9, septiembre 2001 15


Jordi Serra Serra

—Ya no es posible evaluar únicamente documen- digitales es difícil seguir manteniendo la misma divi-
tos. Se deben evaluar las funciones y los procesos que sión, puesto que las decisiones que antes se debían to-
producen documentos. mar en cada una de las fases las tomará automática-
mente el sistema a partir de la información que se le
—Son los archiveros40 quienes deben definir los
proporcione durante el análisis y diseño. Parece nece-
requerimientos funcionales para la gestión del ciclo de
sario sustituir esta periodización por modelos basados
vida de los documentos digitales de una organización.
en considerar el ciclo de vida de los documentos ad-
—La evaluación debe realizarse en la fase de dise- ministrativos como un continuum, un destino que tie-
ño de los sistemas informáticos. nen escrito los documentos evaluados, y que puede ser
reescrito si cambian las condiciones del entorno de uti-
—Los conjuntos de metadatos que se asocian a los lización43. En este caso se debe admitir la posibilidad
documentos deben incluir elementos que sirvan para de reevaluar los documentos periódicamente o con
describir las diferentes etapas de su ciclo de vida. motivo de la migración a un nuevo entorno tecnológi-
Quiero insistir en la afirmación de que las reglas de co44 (tabla 2)45.
evaluación deben introducirse en el sistema informáti- 4. Conclusión
co de la organización antes de que se empiecen a gene-
rar documentos. El objetivo es asegurar que los docu- El problema de la conservación de los documentos
mentos con valores secundarios serán conservados en electrónicos reside tanto en la diversidad de soluciones
una forma auténtica, y esto no es posible si el formato tecnológicas como en la falta de cohesión de las solu-
original no facilita la migración, si no se han recogido ciones metodológicas que se aplican. A modo de con-
los metadatos suficientes o si no se han conservado clusión quiero citar el acertado colofón conceptual que
también los documentos y conjuntos de datos que con- pone Margaret Hedstrom a esta problemática, cuan-
figuran el contexto documental. La elección de la es- do detalla las condiciones básicas para una estrategia
trategia de conservación a largo plazo (tipo de migra- de preservación digital46. Estas condiciones se resumen
ción, estándares, metadatos, etc.) es una de las decisio- en la necesidad de disponer de un sistema de gestión
nes que se deben tomar durante la evaluación, e impli- documental que garantice la conservación de los docu-
ca participar, junto con los analistas informáticos, en el mentos digitales, y que sea:
diseño de sus sistemas, pasando de la tradicional eva- —Implantado: Las posibilidades de conservar los
luación enfocada a los documentos a evaluar la estruc- documentos electrónicos van asociadas al nivel de im-
tura del sistema de información de la organización41. plantación real del sistema de gestión documental. El
conocimiento detallado de los documentos que se de-
Para gestionar con eficacia la documentación ad-
ben conservar es la premisa básica para articular una
ministrativa tradicionalmente se ha utilizado una pe-
estrategia de preservación digital.
riodización por etapas orientada a optimizar los recur-
sos invertidos. La más habitual consiste en distinguir —Integrado: Es necesario que la gestión de los do-
una fase de utilización administrativa o activa, una fa- cumentos que pertenecen a un mismo fondo sea inte-
se semiactiva y una fase inactiva. Con los documentos grada, con independencia de su soporte y ubicación.
Dinamarca Finlandia Francia Alemania Suecia Reino Unido
Fecha de creación 1973 1995 1986 1991 1983 1998
6500 docum. 2 Terabytes de
Volumen
4500 cintas 6000 docum. 23000 docum. información 25 bases de datos
de datos
200 CD-ROM 11500 cintas
Cinta
Cinta
DLT4000 Cinta Cinta
Tipo de DAT
CD-R DAT DLT7000 DAT DAT
soporte CR-ROM
DAT CR-ROM CR-ROM
CD-R
Óptico
ASCII
Formatos ASCII
ASCII ASCII ASCII EBCDIC PostScript
de texto EBCDIC
SGML
Formatos de ASCII ASCII ASCII
ASCII ASCII ASCII
bases de datos EBCDIC EBCDIC EBCDIC
Formatos TIFF 6.0
TIFF 6.0 TIFF TIFF 6.0
de imagen CCITT/TSS
Tabla2. Archivos digitales nacionales en Europa

16 El profesional de la información, vol. 10, nº 9, septiembre 2001


Gestión de los documentos digitales: estrategias para su conservación

Los documentos digitales deben gestionarse conjunta- La fiabilidad depende de las condiciones de creación del documento (la
fiabilidad del autor, el grado de control ejercido durante su creación y la
mente con los documentos en soportes tradicionales. integridad o nivel de completitud del documento), mientras que la autenti-
cidad depende de las condiciones de utilización y, posteriormente, de con-
—En la fase de diseño: Las reglas de evaluación servación (los mecanismos de transmisión y de custodia).
deben incorporarse a los sistemas informáticos en la
7. Sobre la formulación de la teoría de los valores véase: Schellenberg,
fase de diseño. T. R. Archivos modernos: principios y técnicas. La Habana: Instituto Pa-
namericano de Geografía e Historia, 1958, p. 163-210.
—Controlado: Se deben establecer políticas que
eviten que la decisión sobre la conservación o elimina- 8. Hofman, Johannes. “Shooting at a moving target: The development of
a repository for the preservation of digital information”. En: European
ción de documentos, o sobre la aplicación de las reglas Commission. Proceedings of the DLM-Forum: European citizens and
de evaluación, recaiga sobre el usuario del sistema. electronic information: the memory of the information society. Luxem-
bourg: Office for Official Publications of the European Communities,
—Normalizado: La tan demandada normalización 2000, p. 81.
no se debe restringir a los formatos. Los métodos de
9. Comité sur les documents électroniques. Guide pour la gestion archi-
trabajo y las herramientas conceptuales deben seguir vistique des documents électroniques. Paris: Conseil International des Ar-
también un proceso de normalización que permita su chives, 1997. (Études, 8), p. 53-56.

integración con los sistemas informáticos47. 10. Conchon, Michèle. “Traitement et conservation des archives infor-
matiques en France: la méthode Constance”. En: Commission Européen-
Bibliografía y notas ne. Actes du DLM-Forum sur les données lisibles par machine. Luxem-
bourg: Office des publications officielles des Communautés européennes,
1997, p. 146-151. También en: Dhérent, Catherine. “The Archives of
1. En los documentos firmados digitalmente es necesario adoptar una po- France: policy on storing electronic documents”. En: European Commis-
lítica para la conservación de las claves de encriptación. sion. Proceedings of the DLM-Forum: European citizens and electronic
information: the memory of the information society. Luxembourg: Office
2. Kampffmeyer, Ulrich. “E-documents: It’s all legal, or is it?”. E-doc, for Official Publications of the European Communities, 2000, p. 172-179.
2000, septiembre-octubre, p. 31-33.
11. Las 4.500 cintas existentes fueron reemplazadas por 40 discos ópti-
3. El Real decreto ley 14/1999, de 17 de septiembre, sobre la firma elec- cos, con un coste de tres millones de francos. Desde mayo de 1999, 20
trónica regula las funciones de los prestadores de servicios de certifica- cintas han reemplazado a los 40 discos ópticos.
ción (las “notarías digitales”), los cuales autentican las transacciones tele-
máticas privadas o públicas mediante un sistema de claves asimétricas. 12. Hasta el momento todos los metadatos recopilados sobre cada docu-
Cabe destacar el artículo 3.1. “La firma electrónica avanzada, siempre mento digital, y las fichas descriptivas asociadas, se conservan preferente-
que esté basada en un certificado reconocido y que haya sido producida mente en papel. Se está experimentando en la digitalización de estas des-
por un dispositivo seguro de creación de firma, tendrá, respecto de los da- cripciones.
tos consignados en forma electrónica, el mismo valor jurídico que la fir-
ma manuscrita en relación con los consignados en papel y será admisible 13. Transfer of electronic records (from 36 CFR 1228.270 - formerly 36
como prueba en juicio, valorándose ésta según los criterios de apreciación CFR 1228.188) [en línea]. Washington, DC: National Archives and Re-
establecidos en las normas procesales”. cords Administration, last updated April 5, 2001. Consultado: 11-07-
2001. Disponible en:
4. Ley 30/1992 de Régimen jurídico de las administraciones públicas y http://www.nara.gov/nara/electronic/transfer.html
del procedimiento administrativo común, de 26 de noviembre de 1992. En
el artículo 45.5 dice: “Los documentos emitidos, cualquiera que sea su 14. La aceptación de sql e irds como formatos de base de datos es una
soporte, por medios electrónicos, informáticos o telemáticos por las Ad- propuesta del informe presentado en mayo de 1989 por el National Com-
ministraciones Públicas, o los que éstas emitan como copias de originales puter Systems Laboratory del National Institute of Standards and Techno-
almacenados por estos mismos medios, gozarán de la validez y eficacia logy (Nist), a petición de la Nara.
de documento original siempre que quede garantizada su autenticidad, in-
tegridad y conservación y, en su caso, la recepción por el interesado, así 15. Básicamente el diccionario de datos y el conjunto de relaciones.
como el cumplimiento de las garantías y requisitos exigidos por esta u
otras Leyes”. Este artículo fue desarrollado por el Real decreto 263/1996,
16. Rothenberg, Jeff. Avoiding technological quicksand: finding a viable
de 16 de febrero, por el que se reguló la utilización de técnicas electróni-
technical foundation for digital preservation. Amsterdam: European
cas, informáticas y telemáticas por la Administración General del Estado.
Commission on Preservation and Access; Washington DC: Council on Li-
brary and Information Resources, 1999. Véase también Rothenberg,
5. The preservation of the integrity of electronic records [en línea]. Lu- Jeff. An experiment in using emulation to preserve digital publications.
ciana Duranti, Terry Eastwood, Heather MacNeil. Vancouver: Univer- Den Haag: The Koninklijke Bibliotheek; Rand-Europe, 2000.
sity of British Columbia; School of Library, Archival & Information Stu-
dies, 1997. Consultado: 14-07-2001. Disponible en: Otro estudio interesante es: Rothenberg, Jeff; Bikson, Tora K. Carrying
http://www.interpares.org/UBCProject/ authentic records through time in a usable and understandable way. Dis-
ponible en:
6. El valor de un documento como prueba de un hecho y su capacidad pa- http://www.archief.nl/digiduur
ra, a raíz de este valor, dar origen a nuevas acciones están sujetos a que el
documento cumpla dos condiciones: 17. Rothenberg, Jeff, op. cit., 1999.

—Que sea fiable, es decir, que su contenido sea cierto. La fiabilidad es, 18. Véase el comentario de la metodología orientada a objetos en este
por lo tanto, una noción relativa, y por esto se habla del grado de fiabili- mismo artículo.
dad de un documento.
19. La Universidad de Michigan, junto con el proyecto Cedars (Curl
—Que sea auténtico, es decir, que su grado de fiabilidad inicial no se ha- exemplars in digital archives), desarrolla una iniciativa centrada en la
ya alterado desde su creación y durante su utilización y conservación. aplicabilidad de la emulación para ciertos tipos de objetos digitales en los

El profesional de la información, vol. 10, nº 9, septiembre 2001 17


Jordi Serra Serra

que la presentación es esencial. Otra experiencia importante en emulación bourg: Office for Official Publications of the European Communities,
es la que realiza el proyecto Nedlib (Networked European Deposit Li- 2000, p. 113-118.
brary), bajo la coordinación de la Koninklijke Bibliotheek.
http://www.leeds.ac.uk/cedars/ http://www.konbib.nl/nedlib/ 36. Los atributos de un objeto constituyen el estado en que se encuentra.
Un comportamiento es una acción o un proceso que opera sobre un esta-
20. Se puede obtener más información del Formato Universal de Preser- do del objeto.
vación en:
http://info.wgbh.org/upf/ 37. Eastwood, Terry. Appraisal of electronic records: a review of the li-
terature in English. Appraisal Task Force. Interpares project, 2000.
21. Bento specification. Apple Computer Inc., c1993.
ftp://cil.org/pub/cilabs/tech/bento/ 38. La identificación de un documento ya forma parte del proceso de eva-
luación, puesto que permite el estudio del ciclo de vida de dicho docu-
22. Open media framework interchange specification. Avid Technology mento dentro del sistema informático que lo genera.
Inc., c1995.
http://www.avid.com/omf/ 39. Bearman, David. “Archival strategies”. The American archivist,
1995, 58:4.
23. Véase el apartado correspondiente en este mismo artículo.
40. Es este caso la traducción corresponde al records manager, el respon-
24. National Preservation Office. Digital culture: maximising the nation’s sable de gestionar la documentación administrativa de una organización.
investment. Mary Feeney (ed.). London: British Library Board, 1999. En nuestro contexto esta figura corresponde al archivero de un archivo
administrativo que actúa sobre la fase activa de los documentos.
25. Comité sur les documents électroniques, op. cit., p. 48-52.
41. Canela, Montserrat; Campos, Isabel; Domingo, Joan; Serra,
26. Australian Archives. Managing electronic messages as records. Tam- Jordi. “Le processus d’évaluation comme moyen d’intégrer le point de
bién: Peterson, Trudy H. Nara electronic mail regulations, donde se pro- vue archivistique dans la planification, la création et l’utilisation de docu-
ponen los criterios para discriminar los mensajes con valor evidencial del ments électroniques et de systèmes automatisés. Étude de cas”. En: Com-
resto de comunicaciones. Se incluyen en esta consideración otros objetos mission Européenne. Actes du DLM-Forum sur les données lisibles par
digitales típicamente asociados a los programas de correo electrónico, co- machine. Luxembourg: Office des publications officielles des Commu-
mo pueden ser los calendarios y agendas. nautés Européennes, 1997, p. 113-117.

27. Electronic mail policy. University of California; Office of the Presi- 42. Pohjola, Raimo. “Appraisal and disposal of electronic records”. En:
dent, 1998. Principles of appraisal and their application in electronic environment:
European models and concepts. DLM-Experts meeting in Tampere, Fin-
land, 1999.
28. Harries, Stephen. “Capturing and managing electronic records from
websites and intranets in the government environment”. En: European
Commission. Proceedings of the DLM-Forum: European citizens and 43. Hofman, Johannes, op. cit., p. 81.
electronic information: the memory of the information society. Luxem-
bourg: Office for Official Publications of the European Communities, 44. Kowlowitz, Alan. “Appraising in a vacuum: electronic records ap-
2000, p. 72-79. praisal issues: a view from the trenches”. En: David Bearman (ed.). Ar-
chival management of electronic records. Archives and museum informa-
29. Serra, Jordi. “Archivar internet”. El profesional de la información, tics technical report, 1991, n. 13.
1998, núm. 7-8, julio-agosto.
45. Schürer, Kevin. “Survey on the relationship between public adminis-
30. Kahle, Brewster. “Archiving the internet”. Scientific American, tration and archives services concerning electronic records management
March, 1997. Es interesante visitar la página de The internet archive: in the EU Member States.” En: European Commission. Proceedings of
building an internet library, que actualmente cuenta ya con 4 billones de the DLM-Forum: European citizens and electronic information: the me-
páginas web almacenadas, 16 millones de mensajes de Usenet y 360 pelí- mory of the information society. Luxembourg: Office for Official Publica-
culas que en total ocupan más de 40 terabytes de memoria. Consultado: tions of the European Communities, 2000, p. 219-235.
14-07-2001.
http://www.archive.org/index.html 46. Hedstrom, Margaret; Kowlowitz, Alan. “Meeting the challenge of
machine readable records: a state archives perspective”. Reference servi-
31. http://pandora. nla.gov.au/pandora/ ces review, 16(1/2), p. 31-40.

32. Berninger, Peter. Website electronic records management (Werm) in 47. Véase:
the European Commission. January 2000. US Department of Defense 5015.2 Standard:
http://jitc.fhu.dis.mil/recmgt/
33. Como ejemplo, la Nara ha evaluado todas las páginas web estáticas
del Gobierno Federal disponibles en internet a partir del 20 de enero de Standard for the management of electronic records, del Vers:
2001 como documentos de conservación permanente. Para su preserva- http://www.prov.vic.gov.au/vers/
ción captura periódicamente una “instantánea” de las páginas web guber-
namentales. General records schedule 20 de los archivos de los Estados Unidos.
http://www.nara.gov/records/grs20/
34. http://www.prov.vic.gov.au/vers/welcome.htm
En Europa se está trabajando en un estándar de gestión documental
35. Thibodeau, Kenneth. “Limites et transformations: une stratégie (ISO/CD 15489).
orientée objet pour la conservation des documents électroniques”. En: Oais (Open archive information system)
Commission Européenne. Actes du DLM-Forum sur les données lisibles
par machine. Luxembourg: Office des publications officielles des Com- Jordi Serra Serra. Facultat de Biblioteconomia i Docu-
munautés européennes, 1997, p. 161-167. También en: Thibodeau, Ken- mentació. Universitat de Barcelona.
neth; Moore, Reagan; Baru, Chaitanya. “Persistent object preservation:
DLM-Forum on electronic records, Monitoring committee.
advanced computing infrastructure for digital preservation”. En: European
Commission. Proceedings of the DLM-Forum: European citizens and serra@fbd.ub.es
electronic information: the memory of the information society. Luxem- jordiserra@correu.gencat.es

18 El profesional de la información, vol. 10, nº 9, septiembre 2001