GESTIÓN DE CONTENIDOS EN LOS ARCHIVOS ELECTRÓNICOS

Ing. Hernando Cruz M. Departamento de Ciencia de la Información, Pontificia Universidad Javeriana, Bogota D.C., Colombia. Correo Electrónico: hcruz@javeriana.edu.co LOS ANTECEDENTES Y EL CONTEXTO Es necesario considerar que hoy existe un concepto ampliado de lo que definimos en las anteriores décadas como archivo, este concepto ampliado se relaciona con el concepto de contenido dentro de contextos específicos, como por ejemplo, los contextos histórico, económico, legal, gubernamental, educativo, editorial, militar, tecnológico y científico que operan sobre la infraestructura de las redes de telecomunicaciones y la Internet, entre otros ambientes. Es la misma percepción que la NIST, ISO y la UNESCO plantearon y formularon desde sus primeras reuniones técnicas y estratégicas desde mediados del siglo pasado y que estaban orientadas a analizar la estructura del documento electrónico, el etiquetado, la esquemática y estandarización de los contenidos o los efectos y relaciones de la preservación digital sobre el patrimonio cultural de una nación. Lo anterior, ya ha tomado forma no sólo en el ámbito académico, también en el industrial y de la organizaciones; puedo citar, específicamente, los planteamientos de Morville 1 (2000) quien al establecer las condiciones estructurales de una arquitectura de información nos exige la consideración del contexto respecto al desarrollo de contenidos o, podemos recordar, a Fox 2 (2003) quien ya formulaba en su conferencia en Berlín una taxonomía del contenido pero asociada a los metadatos, con especificas definiciones de tipo de documento o archivo. Esta ponencia tiene como objetivo presentar desde estos antecedentes y contexto, algunos elementos que sintetizan el actual desafío que las organizaciones y la industria están enfrentando, y los parámetros estructurales que están empleando para gestionar los contenidos y los sistemas de archivo. LAS TENDENCIAS Y LAS CIFRAS DE CRECIMIENTO En forma paralela al trabajo realizado por las organizaciones y la academia, la industria relacionada con la gestión de archivos y con el desarrollo de la automatización de procesos o sistemas de transacción formulo y estructuro un concepto de esquemática, en la cual los archivos son estructuras fundamentales, esquemática que se asocia en forma sistemática al manejo de contenidos. Lo anterior, se hace evidente si analizamos alguno de los primeros software estandarizados que funcional y orgánicamente permitían establecer un CMS (Content Management System) para el entorno especifico de una empresa u organización; bastaría citar los sistemas CMS de las empresas editoriales o de las compañías que prestan servicios de información científica, sin embargo, la posterior evolución de los CMS nos muestra una ampliación de entornos que nos lleva a los modelos ECM (Enterprise Content Management) y que actualmente enfrenta el desafío de alcanzar la interoperabilidad con la denominación IECM. Si bien desde finales de la década de los años setenta, en el anterior siglo, especialistas como los Laudon 3 (1996) hacían evidente el crecimiento de las industrias orientadas a los servicios de información y a la gestión de contenidos, es solo hasta el inicio de esta década que esto se convierte en un verdadero desafío, no por el simple deseo de automatizar procesos de archivo de las empresa y organizaciones, sino por el mismo origen de los archivos, documentos o las fuentes. Adicionalmente, las formas de captura, almacenamiento, preservación, recuperación y diseminación en redes, apoyadas por sistemas computacionales y de gestión de bases de datos (DBMS) generaron una cultura de la gestión de información y del archivo en donde el perfil del usuario y sus niveles de abstracción cambiaron a tal punto que se hace necesaria no sólo la gestión de los descriptores de archivo o de sus metadatos sino también la gestión de los contenidos mediante el uso de sistemas IECM. Las tendencias y las cifras de crecimiento son evidentes al analizar las gráficas 1 y 2:

1 MORVILLE, Peter. IA2000 En: Information Architecture Conference Keynote. La Jolla, USA Argus Center 2000.

.

:

2 FOX, Edward A. ETD 2003. En: ETDs for Beginners: History and Approach. Berlin: Humboldt University. 2003. 3 LAUDON, Keneth C, LAUDON Jane Price. Management Information Systems:Organization and Tecnology. Chicago: Prentice Hall Inc, 1996. p. 40-59

LOS DESAFÍOS PARA LAS ORGANIZACIONES Y LA INDUSTRIA Previendo este panorama en diciembre de 2006, ZiaContent, Inc. realizó para CM Pros y CMS Metatorial Planner, organizaciones que agrupan cientos de especialistas en desarrollo de contenidos, una investigación entre los desarrolladores de sistemas de contenido, diseñadores y proveedores de servicios de contenido, consultores, integradores y vendedores de sistemas de gestión de contenidos que trabajan en organizaciones de gobierno, educación, asociaciones profesionales o industrias como son las de alta tecnología, servicios financieros, servicios profesionales, mercadeo de bienes, edición y publicidad buscando establecer parámetros que faciliten el desarrollo de sistemas de contenidos relacionados con la gestión de archivos. Particularmente, la investigación buscó identificar o corroborar los parámetros que para el manejo de archivos digitales es necesario considerar antes de emprender el desarrollo de un proyecto; se generaron preguntas abiertas entre la cuales debo resaltar: 1. En su experiencia, ¿cuáles son los cinco más importantes desafíos que usted ha enfrentado cuando implementó el desarrollo de un sistema de administración de contenido? El análisis de las respuestas permitió identificar en forma jerárquica entre el conjunto de los 16 desafíos más citados, incluido un ítem de otros que se definió por convergencia (curiosamente en el ítem otros apareció como desafío la dificultad para relacionar a los sistemas de archivo que gestionan contenido con el cambio y del rediseño de una organización), los siguientes: • • • • • Dimensionar adecuadamente el proyecto en función de su orientación hacia productos y su relación respecto a los costos y el tiempo disponible para desarrollo del proyecto. Establecer cuáles son las metas, la factibilidad económica y, específicamente, los beneficios tangibles e intangibles. Establecer un cronograma realista y lograr establecer procesos de producción paralelos. Jerarquizar, rediseñar y optimizar los procesos que se relacionan con el nuevo sistema. Lograr establecer acuerdos o al menos consensos entre los stakeholders, los diseñadores, los usuarios y los proveedores de tecnología.

En forma paralela y durante el transcurso de este año 2007 otras organizaciones como el NIST y un gran grupo de especialistas norteamericanos, han confirmado la interpretación que desde el 2005 las asociaciones de ECM y empresas como AIIM han buscado o asociaciones Europeas de Archivo 4 como (DLM Forum Et MoEeq2 ) en sus diferentes sesiones de trabajo incluidas las ultimas realizadas en abril y mayo de 2007 en Berlín, han planteado su visión y corroborado que el buen diseño de los sistemas de gestión de contenido relacionados con los archivos de una organización depende de la consideración de parámetros como los siguientes: • • • Coherencia con la misión y las metas de las organizaciones o industrias establecidas sobre modelos de valor agregado o innovación – Factibilidad operativa. Oportunidad para dar soporte e ínteroperar con los demás sistemas de información de la organización y con los flujos de trabajo – Arquitecturas de información. Estimación del valor del contenido para poder establecer un modelo de retorno de inversiones – Factibilidad económica.

4

La sigla DLM significa Document Lifecycle Management y el proyecto MoReq – Model Requirements for the Management of Electronic Records.

• • • • •

Coherencia con el tamaño de la organización, implantación y disponibilidad de tecnologías con suficiente reconocimiento, preferiblemente estandarizadas que permitan establecer el sistema – Factibilidad técnica. Uso de enfoques de rediseño u optimización de procesos, incluidos los de negocios si es el caso. Aplicación de modelos ya probados de planificación y administración de proyectos. Desarrollo de infraestructuras que favorezcan el aprendizaje, las comunicaciones internas y la aplicación de planes de cambio. Definición de políticas o planes estratégicos al menos a mediano plazo que garanticen la continuidad de los procesos.

Estos mismos parámetros están formulados en forma explicita en los resultados de la investigación realizada para la CM Pros y CMS Metatorial Planner por parte de ZiaContent, Inc., sin embargo los grupos de especialistas que se han reunido este 2007 en Europa y Norteamérica en los ya citados eventos, dan igual importancia a parámetros que se relacionan con aspectos más técnicos como son la arquitectura de información del sistema, pero desde una visión de dirección administrativa que muchos relacionamos con gestión o gerencia del sistema valorada en términos de una métrica que emplea indicadores (calidad, usabilidad, eficiencia, eficacia, precisión, etc.); el segundo aspecto técnico que podemos resaltar se relaciona con los estándares en sus diferentes formas o categorías y finalmente nos encontramos con un aspecto que es urgente y se relaciona con la evolución y difusión de los anteriores como forma de dar una respuesta sistemática, en el contexto inicialmente citado, este tercer aspecto técnico es la búsqueda de una convergencia de estándares que facilite la interoperabilidad orgánica y funcional de los sistemas de contenido relacionados no sólo con la gestión de archivos sino con todos los modelos basados en estructuras digitales. ¿POR QUÉ UNA ARQUITECTURA DE INFORMACIÓN? El desarrollo de sistemas CMS que administraban contenidos, esquemas o documentos y su evolución a sistemas de gestión como los ECM (Enterprise Content Management) que sean ínteroperables obliga a considerar enfoques que van más allá de la estructuración por capas del modelo OSI. Por eso tienen sentido los modelos propuestos por Morville (2003) y son válidos aún en el nivel de portales como los desarrollados e investigados por Bliss 5 (2000) para la Corporación Microsoft. La formulación de Bliss fue sociotécnicamente desarrollada, esto es, considero no solo aspectos de ingeniería o métrica, también consideró aspectos sociales, psicológicos, de seguridad y de diseño como la usabilidad de los contenidos y su relación con la ergonomía de la interfaz. Esto explica que desde una convergencia de recursos y de un nivel físico de baja abstracción se pueda proponer su integración mediante una arquitectura de información que opera como elemento estructural de mediación con los niveles de abstracción más altos de los especialistas en diseño, administradores de información y los usuarios en el nivel de vistas más abstractas de un portal empresarial o de una organización. Este enfoque expresa un aspecto fundamental de un ECM, porque tecnológicamente aseguran que procesos como la captura, administración, almacenamiento, preservación y diseminación de contenidos y documentos se relacionen con los procesos más específicos (ej. Producción) de una industria u organización. Adicionalmente, la gestión de los contenidos implica el uso de instrumentos, herramientas y estrategias que permitan la convergencia y gestión de información estructurada o desestructurada en todo el entorno de una organización o industria. En síntesis, el desarrollo de la correcta arquitectura de información, por ejemplo, de una arquitectura orientada a servicios o SOA, facilita el desarrollo o la implantación de instrumentos de trabajo colaborativo, modelos de flujo de trabajo, minería de datos, desarrollo de repositorios o depósitos de información, desarrollo de sistemas de conocimiento, organización de conocimiento o de gestión de conocimiento; además. asegura la continuidad y minimizan los costos de operación. La anterior es la visión que desde el 2005 orienta los desarrollos de los modelos ECM y que actualmente se transforma para poder establecer los sistemas IECM. LA BÚSQUEDA DE LOS ESTÁNDARES Si en algo coinciden los grupo de trabajo académicos, empresariales o de organizaciones mixtas interesadas en el desarrollo de proyectos de archivo que incluyen la gestión de contenidos ya sea en Europa, Norteamérica u organizaciones internacionales o multinacionales como la ISO, W3C, Naciones Unidas, específicamente, la UNESCO, UNeDocs o UN/CEFACT, organizaciones Europeas como IDABC, es en la búsqueda de un conjunto de estándares porque éstos faciliten el análisis, diseño y desarrollo (en general de todas las fases de un ciclo de vida) de sistemas de gestión de contenidos aunque sean de tipo empresarial. Las normas ISO 15489-1 e ISO 15489-2 y el MoReq o modelo de requisitos para la gestión electrónica de archivos, son un ejemplo de esta búsqueda, específicamente, útiles cuando se analiza o diseña un SGDEA, la consideración de estos estándares nos permite una primera aproximación a la estructura de los sistemas ECM. Sin embargo, cuando intentamos establecer los estándares para el diseño de un sistema ECM la complejidad aumenta; esto es evidente por ejemplo al definir el modelo lógico para un ERM (Electronic Records Management) el cual se puede considerar un submodelo del ECM, en este caso cada parámetro (ej. clasificación) asocia subgrupos de estándares.

5 BLISS, Vivian. IA2000 En: Knowledge Architecture: MSWeb case study and beyond. La Jolla, USA: Argus Center 2000.

Una lista de estos parámetros útiles para el desarrollo de las fases asociadas al ciclo de vida de un ERM tendría los siguientes parámetros o subgrupos de estándares: • • • • • • • • • • • • • Términos clave de un submodelo ERM Creación y registros de captura Clasificación Control de acceso Almacenamiento, búsqueda y recuperación Retención y disposición Metadatos Medición y escalonamiento Migración Preservación digital Certificación del software Normas de seguridad Legislación y normas de regulación

CONVERGENCIA E INTEROPERABILIDAD Finalmente, de lograrse una estructura ECM basada en grupos de estándares es posible alcanzar la interoperabilidad, entendida esta como la expresión de una arquitectura que, por ejemplo, permita: • • • • • El uso de múltiples y diferentes contenidos provenientes de varios sistemas ECM. Operar bajo el control de artefactos que exijan el uso de plantillas o esquemas que permitan la recuperación de información desde múltiples sistemas ECM al mismo tiempo. Tener usuarios o clientes validados por el IECM que puedan administrar contenidos desde varios sistemas ECM. Emplear una estructura no centralizada que permita ínteroperación entre los procesos documentales y el uso de los contenidos. Acelerar la diseminación automatizada de documentos a bajo costo y el desarrollo de nuevos servicios en los cuales el contenido sea el elemento estructural.

Actualmente, ésta es parte de la visión de los administradores y diseñadores de sistemas ECM y se encuentra en las estrategias para la gestión de contenidos no sólo para los entornos de empresas sino también para naciones enteras como es el caso de los IECM 6 gubernamentales de los Estados Unidos que están en desarrollo.

6 FONTAINE, Paúl y CONNOR, Mike. ADOBE Corp. y OST. Concept Proposal: A standards based SOA Framework for Interoperable Enterprise Content Management. s.l.: ECM+AIIM 2005.