Archivos de Andalucía

Junta de AndalucíaArchivos de AndalucíaEnlace al directorio institucional de la Cultura (en nueva ventana)

|

Arch-e. Revista Andaluza de Archivos

Nº 1  11 mayo 2009


1.2. La conservación a largo plazo de documentos electrónicos: normativa ISO y esfuerzos nacionales e internacionales

Alejandro Delgado Gómez01 mayo 2009

Descarga este artículo  pdficon_large

 

 

Alejandro Delgado Gómez
Servicio de Archivo y Bibliotecas del Ayuntamiento de Cartagena
3000 Informática
Archivo Municipal. Plaza del General López Pinto s/n. 30201-Cartagena
alejandro@ayto-cartagena.es

 
 
Resumen
 

Ponencia presentada en las Jornadas sobre Normalización en la Gestión de los Documentos en los Archivos celebradas en Sevilla entre los días 24 y 26 de septiembre de 2007. Tras ofrecer una definición de la noción de documentos digitales y establecer unos criterios para la conservación de los documentos electrónicos, se abordan las principales iniciativas desarrolladas en este sentido por la ISO: La norma ISO-15489 y los informes técnicos ISO/TR 15801:2004: recomendaciones para la veracidad y fiabilidad de información almacenada electrónicamente e ISO/TR 18492:2005: conservación a largo plazo de información electrónica basada en documentos, por último se hacen dos recensiones sobre la norma ISO 19005-1:2005: PDF/A-1 y el borrador ISO/NP 26102:Requisitos para la conservación a largo plazo de documentos electrónicos.

 
 
Abstract
 

Speech given at the Conferences on Standardization of Archival Document Management, held in Sevilla, 24-26 September 2007. After presenting a definition of the basics on digital documents and setting the criteria for the preservation of electronic documents, the following initiatives, developed by the ISO within this context, were addressed: The technical standard ISO-15489 and technical reports ISO/TR 15801:2004: Electronic imaging -- Information stored electronically -- Recommendations for trustworthiness and reliability and ISO/TR 18492:2005: Long-term preservation of electronic document-based information, and finally, two critical revisions of the standard ISO 19005-1:2005: PDF/A-1 and rough draft ISO/NP 26102: - Information and Documentation - Requirements for Long-Term Preservation of Electronic Records

 

Palabras clave: Normalización, Preservación digital, Gestión electrónica de documentos, Patrimonio documental

 
Keywords: Standardization, Digital Preservation, Electronic Recordkeeping, Documentary Heritage
 

 
1. Introducción
 

La presente exposición se aplica a la descripción de algunos de los esfuerzos de la Organización Internacional de Normalización (ISO) en lo relativo a la conservación de documentos electrónicos de archivo. Puesto que, a nuestro juicio, estos esfuerzos son, por una parte, aún insuficientes, como intentaremos explicar a lo largo de la exposición; y, por otra, se inscriben en el contexto más amplio de los numerosos proyectos de conservación digital emprendidos por gobiernos, universidades y otras instituciones públicas y privadas, tanto a nivel nacional como internacional, haremos mención también, bien que de manera breve, a algunos de estos proyectos, particularmente los que se adecuan a criterios que en general están siendo considerados como más adecuados que otros, y que indicamos más adelante.

 

En primer lugar, procedemos a un intento de definición de documento electrónico de archivo y de conservación a largo plazo. A pesar de la exclusividad de ambos conceptos, que daría pie para una discusión de al menos las cuatro horas que dura esta sesión, proponemos, con fines puramente prácticos, definiciones convencionales sobre las que se podría concebir un alto grado de acuerdo. En segundo lugar, y también con el apoyo de garantía literaria suficiente, procedemos a sugerir algunos criterios que podrían utilizarse para dilucidar los motivos por los que ciertas nociones de conservación de documentos electrónicos son mejores que otras. En tercer lugar, intentamos hacer frente a algunos de los esfuerzos normativos de ISO, particularmente aquellos que en su momento el Grupo de Trabajo Conjunto (JWG) del Subcomité 3 (SC3) del Comité 171 (TC171) y el Subcomité 11 (SC11) del Comité 46 (TC46) de ISO consideraron como centrales para el empeño de la conservación digital. Nos enfocamos de manera específica sobre ISO/TR 15801, ISO/TR 18492, y, de manera breve, puesto que es cualitativamente distinta, a ISO 19005/A, que por lo demás son los esfuerzos sobre los que está trabajando el Subcomité 1 (SC1) del Comité 50 (CTN50) de Aenor. En el mismo bloque hacemos mención al proyecto normativo ISO/TR 26102, abordado por el citado SC11, y que en el momento de redactar la presente exposición se encuentra aún muy lejos, en nuestra opinión, de ver la luz como norma consolidada. Aunque a lo largo de la exposición de estos documentos intentamos centrarnos en su contenido, eludiendo las valoraciones críticas, también intentamos ponderar, a la luz de otros proyectos, el valor archivístico, mayor o menor, de cada una de las normas citadas. Estos proyectos son, por ejemplo, el marco conceptual de alto nivel de los proyectos Internares (1), el testbed Digital Longevity del Archivo Nacional de Holanda (2), las recomendaciones prácticas del proyecto ExpertiseCentrum eDavid (3), o la implantación específica de un método de conservación en el Archivo Nacional de Australia, mediante herramientas libres como DPR, Xena y Quest (4). Se trata simplemente de muestras seleccionadas entre los múltiples proyectos de conservación digital emprendidos por diversas instituciones, algunos de los cuales tienen reflejo, o han sido tomados en consideración por, las normas citadas. Por último, exponemos algunas conclusiones que, siempre a nuestro juicio, pueden resultar de utilidad.

 
 
2. Definición de documento electrónico y de conservación a largo plazo
 
 

Como se indicó, en la actualidad existen tantas definiciones de documento electrónico y de conservación a largo plazo como paradigmas, escuelas de pensamiento o corrientes de práctica. Su discusión consumiría un tiempo del que carecemos, por lo que haremos uso de definiciones convencionales, asumiendo que existe un alto grado de acuerdo acerca de las mismas.

 

Así, el Proyecto InterPARES define, de manera neutra, el documento electrónico u objeto a conservar como "un documento analógico o digital que es portado por un conductos eléctrico y requiere el uso de un equipo para ser inteligible por una persona" (5). Un documento digital, de acuerdo con el mismo proyecto, se define como "un documento cuyo contenido y forma se codifican utilizando valores numéricos discretos (tales como los valores binarios 0 y 1), más que un espectro continuo de valores (como los generados por un sistema analógico)" (6). Estas definiciones son lo suficientemente neutrales como para permitirnos percibir el amplio y diverso rango de objetos que se esconden tras la aparentemente única noción de documento electrónico: un documento redactado mediante procesador de textos, el PDF de ese documento, una hoja de cálculo, una firma (creada según diversos procedimientos) para validar aquel documento, un correo electrónico, una tarjeta de crédito, otra firma sobre una PDA sin teclado, un sitio web o ciertos componentes o páginas de ese sitio web, dependiendo de la perspectiva que se adopte; una base de datos, compuesta de tablas, instrucciones SQL, vistas, índices, etc.; un conjunto de bases de datos conectadas; un schema XML y las referencias al mismo desde aquel sitio web; una grabación de video o de sonido digitales; un sistema de posicionamiento geográfico o un sistema de georeferencia; un sistema de realidad virtual, un juego interactivo, etc. En realidad, no existe nada similar al "documento electrónico" en nuestro complejo siglo veintiuno: aquello a lo que llamamos documento electrónico está constituido por una amplia diversidad de objetos muy disímiles, para cuya conservación probablemente será preciso aplicar criterios específicos. No obstante, estos criterios específicos, como intentaremos explicar a lo largo de la presente exposición, debieran apoyarse en modelos conceptuales de alto nivel que garantizaran que, al menos, se está obrando de acuerdo con normas, políticas y estrategias bien acordadas y probadas.

 

Es en este sentido en el que el citado proyecto InterPARES define el término conservación: "El todo de principios, políticas y estrategias que controla las actividades diseñadas para asegurar la estabilización física y tecnológica de los materiales (datos, documentos o documentos de archivo) y la protección de su contenido intelectual" (7).

 

Por supuesto, más allá de estas declaraciones genéricas, el esfuerzo de conservación debe reflejarse en implantaciones prácticas específicas. Con todo, como se ha dicho, estas implantaciones prácticas deben basarse en modelos de amplio alcance cuyos criterios de valoración abordamos en lo que sigue.

 
 

3. Criterios para valorar los modelos de amplio alcance de conservación a largo plazo

 
 

En la presente exposición adoptamos el punto de vista de que los documentos electrónicos no se diferencian, en cuanto a su finalidad, de los documentos analógicos; es decir, los documentos electrónicos deben conservarse como evidencia de actos a efectos de responsabilidad y memoria, manteniendo propiedades que, por convención, podrían ser las indicadas para cualquier tipo de documento en la norma ISO 15489, es decir, un documento electrónico de archivo debe ser auténtico, fiable, íntegro y disponible (8). Este debiera ser el primer criterio para ponderar un marco de amplio alcance, es decir, su capacidad para conservar la evidencia asociada a los documentos electrónicos, conservando sus propiedades fundamentales.

 

A pesar de que sus finalidades son idénticas, los documentos electrónicos se diferencian de los documentos analógicos, principalmente, y desde el punto de vista archivístico, por el hecho de que, tal y como indicara David Bearman, son entidades lógicas, no físicas (9). Por supuesto, dicha afirmación no puede pasar sin discusión. En realidad, los documentos electrónicos no sólo son entidades lógicas; también son entidades físicas (de lo contrario, como asevera Luciana Duranti, no haría falta conservarlos) (10), y, en la articulación de Kenneth Thibodeau, también entidades conceptuales. De acuerdo con esta articulación, "un objeto físico es simplemente una inscripción de signos sobre algún soporte físico. Un objeto lógico es un objeto que es reconocido y procesado por un software. El objeto conceptual es el objeto tal y como es reconocido y comprendido por una persona, o en algunos casos reconocido y procesado por una aplicación informática capaz de ejecutar transacciones" (11).

 

Lo que significa la afirmación, por parte de David Bearman, de que los documentos electrónicos son entidades lógicas no es que carezcan de componentes físicos y conceptuales, sino más bien que estos otros componentes son en gran medida de fácil conservación, o al menos de conservación mucho menos difícil que la de los componentes lógicos, a efectos de conservación. Los componentes conceptuales son un resultado del proceso de conservación, no el objeto mismo del proceso; es decir, conservamos documentos electrónicos para que una persona o aplicación pueda recuperarlos de manera reconocible y hacer uso de ellos, a partir de una adecuada política de conservación de los componentes físicos y lógicos. Por su parte, la conservación de los componentes físicos es similar a la de los documentos analógicos: simplemente se inscriben los datos sobre el soporte que en cada momento goce de mejor reputación -un CD-ROM, un DVD, un disco duro externo- y se "almacenan" estos soportes en condiciones de temperatura, humedad, etc., adecuadas. Desde una perspectiva positivista, tal y como la que se deriva de algunas propuestas anteriores de ISO y, en cualquier caso, de la percepción de parte de la profesión informática, esto debiera ser suficiente. Sin embargo, y es en este sentido en el que la afirmación pionera de Bearman resulta crucial, la mera conservación de datos, sin la conservación de la lógica que rigió su comportamiento y uso, devuelve un resultado carente de significado y, por tanto, inutilizable.

 

Por ejemplo, nuestro Centro de Proceso de Datos inició una política de transferencia de sus bases de datos al Archivo consistente en el envío de CD-ROM's que contenían ficheros dmp. Los datos estaban ciertamente allí, y el Archivo podía conservarlos en adecuadas condiciones de temperatura y humedad, e incluso proceder a una política de refresco de soportes en períodos normalizados. Sin embargo, para saber qué contenían, era necesario abrir tales ficheros dmp con un software propietario cuya durabilidad se desconocía, y, una vez abiertos, era imposible saber qué significaban los datos de las tablas, porque se ignoraba la aplicación de la que procedían, el comportamiento o la funcionalidad de tales datos en esa aplicación, e incluso el significado del nombre de los campos.

 

Para conservar estos datos de manera significativa, el Archivo ha emprendido, en colaboración con el Centro de Proceso de Datos, la elaboración de un protocolo de conservación de documentos electrónicos basado en el Testbed Digital Longevity, del Archivo Nacional de Holanda (12), y que implica la conservación de los tres componentes convencionales de todo documento -contenido, contexto y estructura-, además de los componentes derivados de su carácter electrónico, es decir, la forma (13) o representación y el comportamiento o lógica. Por tanto, un segundo criterio para ponderar los modelos conceptuales en uso será su capacidad para conservar inextricablemente vinculados, todos los componentes del documento electrónico: contenido, contexto, estructura, forma y comportamiento. Este, por otra parte, parece ser también el punto de vista en el excelente y exhaustivo trabajo del especialista Ross Harvey: en un entorno electrónico no conservamos artefactos, conservamos información (14).

 

Por último, como tercer criterio, y contra una creencia bastante generalizada en nuestra sociedad y en nuestros entornos de trabajo, la tecnología no lo puede hacer todo, no hace nada parecido a la magia. Como ha indicado, desde el propio punto de vista de la tecnología, Clifford Lynch, en lo que concierne a la fiabilidad de los documentos electrónicos conservados, la tecnología puede ciertamente hacer muchas cosas, pero, en último extremo, la fiabilidad de un documento electrónico conservado depende del grado de confianza que una sociedad determinada esté dispuesta a asumir (15).

 
 

Esto no es nuevo, por supuesto, y ha venido sucediendo desde tiempos inmemoriales con los documentos analógicos: las transacciones privadas falsas se convertían en auténticas al cruzar el umbral del Tabularium en la Antigua Roma; durante la Edad Media, las partes interesadas en una transacción no requerían el documento "perfecto", para ellas era suficiente que los datos quedaran reflejados en la imbreviatura del notario; el papado justificó durante siglos su poder temporal basándose en el estructuralmente válido documento de la Donación de Constantino, cuya falsedad de contenido desveló el humanista italiano Lorenzo Valla, etc. Así, pues, la conservación auténtica de documentos electrónicos no depende sólo de criterios tecnológicos, sino de las condiciones de admisibilidad que una sociedad dada esté dispuesta a asumir (16). En nuestra sociedad, podemos acordar, por convención, y para entornos organizativos, que estas condiciones vienen dadas por ley: por ejemplo, la reciente Ley 11/2007, de 22 de junio, de acceso electrónico de los ciudadanos a los Servicios Públicos, el Real Decreto 1553/2005, de 23 de diciembre, por el que se regula la expedición del documento nacional de identidad y sus certificados de firma electrónica; el Real Decreto 209/2003, de 21 de febrero, por el que se regulan los registros y las notificaciones telemáticas, así como la utilización de medios telemáticos para la sustitución de la aportación de certificados por los ciudadanos; la Ley 59/2003, de 19 de diciembre, de firma electrónica; y muchas otras disposiciones de distinto rango a las que se puede acceder, por ejemplo, desde el sitio web del Consejo Superior de Administración Electrónica (17).

 

Establecidos estos criterios de ponderación, por supuesto discutibles pero que proporcionan un marco de referencia, pasemos a considerar algunos de los modelos de amplio alcance, y derivados prácticos de los mismos, enunciados en la introducción de la presente exposición.

 
 

4. Los esfuerzos de la Organización Internacional de Normalización (ISO) en lo relacionado con la conservación de documentos electrónicos

 
 

En lo que se refiere a la conservación a largo plazo de documentos, tanto analógicos como digitales, los esfuerzos de ISO tienen una larga historia, evidente, por ejemplo, en el trabajo del TC171 (Aplicaciones de gestión de documentos) y sus tres sub-comités (calidad, cuestiones de aplicación y cuestiones generales), más un grupo asesor. Aunque el citado Comité mantiene relaciones, tanto con el TC46 (Información y documentación) como con organismos del estilo del Consejo Internacional de Archivos (ICA) y la Federación Internacional de Asociaciones e Instituciones de Bibliotecas (IFLA), su empeño ha estado siempre más orientado a la conservación del artefacto que a la conservación de la lógica, particularmente en el entorno analógico, como demostrarían, por ejemplo, sus muchas normas acerca de la gestión de la conservación en microformas.

 

Sin embargo, en fecha reciente, las relaciones entre el TC 171 y el citado SC11 (Gestión de archivos/documentos) ha producido algunos resultados, si no impecables, al menos mejor informados desde el punto de vista archivístico. Así, por ejemplo, el grupo de trabajo conjunto TC171/SC11 produjo un borrador de cuerpo central de normas técnicas a ser tomadas en consideración a efectos de conservación, en el que, junto a normas técnicas especialmente dependientes de la conservación de los datos, incluía las dos partes de ISO 15489, así como dos informes técnicos, ISO/TR 15801 e ISO/TR 18492, que tomaremos en consideración algo más adelante. En la actualidad el grupo de trabajo conjunto está colaborando en el desarrollo de PDF, bajo el mando del SC2 (Cuestiones de aplicación) del TC171.

 

Por su parte, el SC11 ha producido un borrador de norma archivística acerca de la conservación a largo plazo de documentos electrónicos (18). Sin embargo, como toda norma, precisa de un, a nuestro juicio, todavía largo proceso de depuración, de tal manera que referirse en este momento a su contenido resulta en el mejor de los casos aventurado. Con todo, y puesto que en algún momento será la norma ISO de conservación archivística de documentos electrónicos, una breve aproximación a su estructura actual, con todas las precauciones que sean del caso, no parece del todo inoportuna.

 

Analizamos, pues, el contenido de los tres productos normativos del TC171 asociados a la conservación a largo plazo en entornos electrónicos que guardan una relación más estrecha con los requisitos archivísticos de conservación y que en este momento se están considerando de una u otra manera a nivel nacional; así como el actual borrador de norma ISO 26102. Metodológicamente, se expone el contenido de los documentos, atendiendo en el menor grado posible a valoraciones críticas, que esperamos se deriven a lo largo de la exposición de su contraste con otros proyectos marcadamente archivísticos.

 

 

5. ISO/TR 15801:2004: recomendaciones para la veracidad y fiabilidad de información almacenada electrónicamente (19)

 
 

De acuerdo con la propia justificación del informe técnico que nos ocupa, el uso como evidencia legal de documentación creada, capturada o almacenada de manera electrónica es una realidad creciente. De ello se deriva la necesidad para las organizaciones de gestionar esta documentación electrónica utilizando procedimientos que garanticen su admisibilidad legal. El informe técnico se aplica a la descripción de algunos de estos procedimientos, de manera específica aquellos que se derivan del contexto tecnológico de la documentación. Básicamente, pues, el informe técnico propone las condiciones que se han de dar para garantizar técnicamente que ciertos tipos de documentos electrónicos no se han modificado desde el momento de su creación o captura; así como para garantizar que, si el documento electrónico procede de un documento físico fuente, es una reproducción verdadera y fiable de ese documento fuente.

 

En cuanto a su alcance, el informe técnico se define adecuado para entornos de sistemas de gestión de la información que almacenan documentación electrónica y en los que las condiciones de veracidad, fiabilidad, autenticidad e integridad son importantes. Es decir, básicamente el informe técnico se aplica a la documentación electrónica que puede ser requerida como evidencia legal en algún momento.

 

El informe técnico se estructura en una introducción, que establece los principios generales, y ocho capítulos. Los tres primeros capítulos son los convencionales en cualquier documento ISO: alcance, normativa de referencia y vocabulario. Los restantes cinco capítulos se aplican a discutir los principios que deben regir los siguientes aspectos: políticas de gestión de la información, deber de custodia, procedimientos y procesos, tecnologías capacitadoras y pista de auditoría. Estos capítulos tienen un nivel de detalle diferente, siendo los dos primeros de carácter más programático y, por tanto, menos extensos; y los tres últimos de carácter más técnico y, por tanto, más detallados.

 

El capítulo acerca de políticas de gestión de la información del informe técnico parte de la premisa de que la información es uno de los capitales más importantes de cualquier organización. Como tal, la información tiene que gestionarse -clasificarse, estructurarse, validarse, ser asegurada, ser valorada, supervisarse... El modo en que se gestiona la información debe quedar reflejado en un documento de política de gestión de la información, cuyos requisitos analiza el capítulo 4 del informe técnico.

 

Un documento de política de gestión de la información debe ser apoyado y aprobado por los niveles más altos de gestión de la organización. De igual modo, debe revisarse periódicamente. Tal documento debe contener al menos secciones que especifiquen los siguientes aspectos:

 
  • Información cubierta por el documento. Para ello, la información debe agruparse por tipos, de tal manera que la política para toda la información dentro de un tipo sea coherente.
  • Política respecto a soportes de almacenamiento. De acuerdo con los requisitos legales de admisibilidad jurídica y con las propias necesidades funcionales de la organización, el documento debe indicar qué soporte de almacenamiento se utilizará para qué requisitos de la organización. Los requisitos son, por ejemplo, las condiciones de acceso, los requisitos de seguridad o los períodos definidos de retención. Cada uno de estos requisitos puede exigir un tipo diferente de soporte de almacenamiento -papel, microforma, CD-ROM- para diferentes etapas de la vida de los documentos.
  • Política respecto a formatos de ficheros de imagen y controles de versión. De igual modo, para cada requisito, función o tipo de documento, puede que se requiera un diferente formato de fichero de imagen, así como documentación relevante acerca de políticas de migración y de compresión, y de controles de versión, con el fin de garantizar la usabilidad de los ficheros a largo plazo.
  • Política respecto a las normas relevantes de gestión de la información. El documento debiera contemplar toda la normativa relevante, que puede tener carácter legal a nivel nacional o internacional; carácter técnico, o carácter industrial. Un ejemplo sería el cuerpo normativo ISO 9000. Indíquese que la consideración a la normativa de tipo jurídico y técnico es una constante a lo largo de los diferentes capítulos del informe técnico.
  • Políticas de retención y destrucción. De acuerdo con el informe técnico, debiera establecerse un programa de retención para cada tipo de documento. En dicho programa debieran participar tanto todos los departamentos relevantes de la organización, como los adecuados asesores legales. El programa de retención debiera aplicarse a toda la documentación producida por la organización, debiera revisarse periódicamente, y debiera prever procedimientos controlados de destrucción.
  • Responsibilidades para chequear el cumplimiento de esta política. Finalmente, el documento de política de gestión de la información debe incluir un apartado en el que se defina quiénes son los responsables individuales o corporativos de chequear el cumplimiento de los requisitos establecidos en los anteriores apartados, la admisibilidad legal de tales requisitos, y las revisiones periódicas del documento.
 

En cuanto al principio de deber de custodia, y de acuerdo con el capítulo 5 del informe técnico, éste se refiere a la responsabilidad de la organización respecto al valor de la información que está almacenando, y debe quedar controlado mediante procedimientos que establezcan una cadena de responsabilidad y asignen responsabilidades para todas las actividades de gestión de la información a todos los niveles; de igual modo, la organización debe ser consciente de los cuerpos legislativos y reguladores pertinentes, así como mantenerse al tanto del desarrollo técnico, procedimental, regulador y legislativo en su área de trabajo. Por último, la organización debe desarrollar e implantar una política de seguridad de la información. Este último deber es especialmente importante, y el informe técnico lo desarrolla del modo que se expone a continuación.

 

Puesto que toda la información es susceptible de sufrir pérdidas o cambios accidentales o maliciosos, es necesario definir medidas que permitan reducir estos riesgos y proteger la autenticidad de los documentos. Estas medidas tiene que ser coherentes con los niveles de seguridad asignados a los documentos, así como con una evaluación de los riesgos y de los costes asociados a la eliminación de tales riesgos. La definición de medidas de seguridad debe contemplar igualmente la capacidad para disponer de los documentos en cualquier momento y utilizar procesos de copia de seguridad.

 

Antes de definir una política de seguridad de la información, la organización debiera llevar a cabo un análisis estructurado de riesgos, cruzando variables tales como el valor de la información, la vulnerabilidad del sistema o la probabilidad de un ataque. Una vez descubiertos de manera específica los riesgos que corre la información, es posible redactar un documento donde queden reflejadas las medidas de seguridad a adoptar. En este sentido, el análisis de la política de soportes de almacenamiento y de copia de seguridad resulta esencial.