You are on page 1of 4

Edición de Metadatos en nuestros Archivos

Ma. Cristina Dávila B. macristinadb@gmail.com

Resumen En este artículo conoceremos la importancia de los metadatos de todo archivo, los estándares que existen y la manera en cómo éstos pueden ser editados y/o eliminados. Para ello se describen algunas herramientas existentes tanto para Sistemas Operativos Windows como Linux que nos permitirán editar el metadato de archivos pdf, archivos Microsoft Office, Imágenes, archivos de audio y video. Palabras Clave Metadatos, PDF, Archivo, Estándares, Heramientas.
I. Introducción

búsqueda, pero por otro lado son un riesgo de seguridad por la cantidad de información que se transmiten sin que tengamos control sobre el mismo. Los metadatos pueden tener varias aplicaciones como: * En informática forense: Para demostrar en un juicio que unos archivos de imágenes pertenecen a una determinada cámara de fotos. * En ataques a sistemas o servidores web: A través de los metadatos podemos obtener los nombres de posibles usuarios, sistema operativo, nombres de red… para después realizar un ataque de fuerza bruta. Los metadatos pueden dividirse en dos categorías:  Metadatos de aplicación Son aquellos que son creados automáticamente por una aplicación y están incrustados en todos los archivos que son creados o modificados con ese software.  Sistemas de Metadatos Los sistemas operativos que controlan máquinas individuales, servidores y otros dispositivos, crean sistemas de metadatos, los cuales fijan una tabla de asignación de campos de archivo (nombre de archivo, creación, extensión, y el uso) a todos los archivos almacenados en el sistema de forma tal que el sistema operativo puede identificar y localizar cualquier archivo. Los sistemas de metadatos residen en el sistema de registro del sistema o el servidor utilizado para acceder y almacenar ese archivo. Estándares 1. Dublín Core Metadata Iniciativa Foro abierto dedicado al desarrollo de estándares en la línea de los metadatos http://dublincore.org/

Día a día, pequeñas, medianas y grandes empresas almacenan e intercambian información de manera electrónica tales como registros contables, informe de ventas, etc., exponiendo de esta manera información sensible o que no es pública a un grupo de personas que pueden en muchos casos aprovechar de los metadatos para obtener datos confidenciales.
II. ¿Qué son los Metadatos?

Videos, imágenes, documentos y otros archivos contienen información oculta acerca de su origen, fecha de creación, autor, coordenadas, entre otros. A este conjunto de información sensible se les denomina Metadatos, éstos incluyen información sobre el documento y su contenido, son considerados como armas de doble filo, ya que por un lado nos permiten clasificar y organizar los contenidos de la propia librería de documentos y por ende puede ser empleada por las utilidades de

incluido el texto eliminado que ya no es visible en la pantalla  Versiones del documento  Información sobre cualquier modelo o plantilla utilizado al crear el archivo  Texto oculto y observaciones [2]. Por ejemplo. datos generales. en este caso Word: 1. ISO 19115 “Geographic Information Metadata” Norma Europea . Una vez abierta la ventana de propiedades se puede navegar por ella viendo. la cual identificará los metadatos en un archivo de Office. Algunas aplicaciones incluyen herramientas específicas para eliminar metadatos.2. contenido. estadísticas. y un campo para personalizar. Otro tipo de metadatos que se añaden . 4.Archivos Microsoft Office Microsoft indica que los siguientes metadatos pueden ser almacenados en documentos creados en todas las versiones de Word. y así información de creación de archivos.CEN/TC287 Norma Española . Excel y PowerPoint:  Nombre y las iníciales (de la persona que creó el archivo)  Nombre de la organización  Nombre del equipo  Nombre de la unidad de disco duro local o servidor de red dónde ha guardado el documento  El nombre y el tipo de impresora que imprimió el documento  Otras propiedades de los archivos y resumen de la información  Partes de objetos OLE no visibles  Los nombres de los autores anteriores del documento  Revisiones del documento. y proporcionará las opciones para eliminar. A1. modificaciones entre otras. Extensible Metadata Platform XMP Adobe XMP (XMP) es una tecnología de etiquetado que le permite integrar los datos acerca de un archivo. Abrir Archivo. Propiedades Archivos Office 2. A continuación mostramos una manera de ver los metadatos con el programa que generó el archivo. Ilustración 2. Microsoft Office 2007 y 2010 incorporan una herramienta llamada “Inspector de Documentos”. Propiedades Archivos Office Las propiedades del archivo representan solo una parte de los metadatos almacenada en los documentos. resumen. selectivamente. Propiedades Ilustración 1.AEN/CTN148 3. Núcleo Español de Metadatos “NEM” Información geográfica Foro abierto dedicado al desarrollo de estándares en la línea de los metadatos. algunos o todos los metadatos.

# apt-get install pdftk Otras herramientas para detectar y evitar metadatos en archivos office. el proceso y el intercambio de los metadatos de documento entre los flujos de trabajo de autoedición. Cada formato de archivo tiene reglas únicas en cuanto a cómo los formatos de metadatos deben ser almacenados dentro del archivo.0 o posterior contienen metadatos de documento en formato XML.pdf A4-Archivos de Imágenes Las imágenes digitales son almacenadas en una variedad de formatos de archivo comunes como TIFF. los metadatos pueden ser almacenados dentro de una variedad de formatos comunes de contenedor de metadatos como Exif/TIFF IFDs.txt output archivo_salida. título del documento. Opción Campo en MSOffice [7]. Para la extracción de metadatos del documento en PDF se puede apoyar en la herramienta Foca (http://www.Metadata Analyzer Este programa se encarga de comprobar los documentos de MS Office: Microsoft Word. fecha de creación. Dentro de cada formato de archivo de imagen. En ambiente Linux podemos recurrir a PDFTK PDF Tool Kit que permite hacerlo desde consola de una manera muy sencilla. Recursos de Imagen de Fototienda (PSIR) y IPTC- . etc). Puede guardar e importar el código fuente XML de los metadatos en formato XMP. Entre otras opciones como autor del documento y fechas de creación. Control de Cambios y Versiones.informatica64. 3. BeCyPDFMetaEdit es gratuito. Microsoft Excel y Microsoft PowerPoint en busca de este tipo de información. XMP (Extensible Metadata Platform) proporciona a las aplicaciones de Adobe un marco de trabajo XML común que estandariza la creación. Para instalarlo en Ubuntu seria tan facil como un: Ilustración 3. El programa analizará los documentos y informará de toda la información privada que encuentre. compatible con Windows 7/Vista/XP/2000. JPEG y PSD así como formatos propietarios como RAW. lo que hace que compartir datos entre diferentes documentos sea fácil.al documento son mediante las opciones de Campo.pdf update_info metadatos. También permite añadir contraseñas en archivos PDF para evitar su divulgación a personas no conocidas. También puede guardar metadatos del documento en una plantilla de metadatos que puede reutilizar en Acrobat.com/foca). A2. el Adobe XMP. Las opciones de campo permiten ver la cantidad de tiempo empleada para editar el documento por parte de los usuarios. (1) Para modificar los metadatos primerio tendriamos que crear un archivo con los datos en cuestión siguiendo el siguiente patrón: InfoKey: Key InfoValue: Valor InfoKey: Title InfoValue: Modificar Metadatos y luego en una consola: pdftk archivo.Archivos PDF Los documentos PDF creados en Acrobat 5. luego proceder a la edición/eliminación de los metadatos con la ayuda de la herramienta: Becy PDFMetaEdit : Esta herramienta permite cambiar los metadatos de un archivo (autor. están: . etc. esto nos permite analizar los metadatos. y se distribuye en dos versiones: portable e instalable.

Como recomendación se sugieres antes de enviar o publicar un archivo. Además reconoce metadatos insertados por cámaras: Canon. pdf imagenes http://www. Leaf. Nikon. Mac OSX y en modulo Perl lo que permite utilizarla en Linux. que a pesar de su nombre soporta muchos otros formatos de audio y va cargado con todas las opciones imaginables a la hora de trabajar con los metadatos.0 [4] http://www.0 [5] http://www.hackxcrack.com/es_ES/acrobat/pro/usin g/WS58a04a822e3e50102bd615109794195ff7c63. doc. Casio. Esta escrita en python.html [2] Codeplex Project con algoritmos de codificación para HTML XML CSS JavaScript.html . ExifTool. Este artículo a presentado de manera breve y concisa la importancia de los metadatos en nuestros archivos y los mecanismos de seguridad apoyados en herramientas gratuitas a tomarse en cuenta para el resguardo de nuestra informacion.net/2010/04/metadatosen-los-archivos-de-audio. en sitios de redes sociales como Flickr. considerar el impacto de éste si contiene metadatos.sno.daltonico. http://help.queensu. FujiFilm.hackxcrack. Puedes arrastrar y soltar los archivos en la ventana o abrir múltiples archivos utilizando “Open Files”. REFERENCIAS BIBLIOGRAFICAS [1] Adobe Help. Ricoh. Twitter o Facebook.es/forum/index. fácilmente instalable desde los repositorios oficiales de las principales distribuciones. la mejor herramienta para extraer metadatos de imágenes ya que puede trabajar con EXIF e IPTC (estándares utilizados por cámara de fotos para intercambiar ficheros de imágenes con compresión JPEG). Pentax/Asahi. (http://www. Sanyo.phy. Minolta/KonicaMinolta. HP. Olympus/Epson.es/forum/index. conocida como Vorbis comment. La mejor manera de poder comprobar si una aplicación es vulnerable a referencias inseguras a objetos es verificar que todas las referencias a objetos tienen las protecciones Aunque algunos reproductores multimedia como foobar2000 soportan la edición de los metadatos de las canciones. Cuando eliminas los metadatos la calidad de la imagen no se altera.com/metagoofil.adobe.php?to pic=10729.php?P HPSESSID=10ailjp57dcit3or1nnt37hpl5&topic =8027. hay programas especializados que facilitan mucho las cosas a la hora de etiquetar grandes cantidades de archivos:   En Windows destaca MP3TAG. Esto es especialmente importante al publicar archivos.w. xls y ppt de un sitio web a través de google. y analizar los metadatos de los archivos.php) (5) A4-Archivos de Audio y Video Formatos de audio posteriores a MP3 como Vorbis y FLAC tienen su propia forma de incluir metadatos.ca/~phil/exiftool/) Metagoofil. Para obtener información y realizar un ataque o un test de intrusión. En Linux existe una aplicación similar aunque algo menos potente llamada EasyTAG. Más información y descarga: (http://www. [3] Edit openoffice. Panasonic/Leica. diseñada para extraer archivos: pdf. Disponible para Windows.edge-security. JVC/Victor.IIM. Conclusión III. Kodak. como fotografías o videos. Entre las herramientas más conocidas tenemos para editar el metadata de una imagen tenemos: MetaData Stripper es una herramienta gratuita portable y ligera para remover y limpiar los metadatos innecesarios de los formatos comunes de archivos de imagen. Sigma/Foveon y Sony.