You are on page 1of 23

http://www.ibict.

br

Manual de alteraes no Dspace para adequao s diretrizes DRIVER


junho de 2011 Milton Shintaku Robson Almeida

Laboratrio de Metodologias de Tratamento e Disseminao da Informao

Sumrio
Lista de Figuras....................................................................................................3 1. Introduo......................................................................................................................4 2. Diretrizes DRIVER.........................................................................................................5 H vrias iniciativas que coletam e indexam documentos cientficos no mundo. No Brasil, temos a SciElo (Scientific Electronic Library Online) que agrega diversos peridicos cientficos, a BDTD (Biblioteca Digital de Teses e Dissertaes), entre outros. Todos esses servios possuem padres que permitem a interoperabilidade de metadados, facilitando o processo de indexao e a possibilidade de gerao de indicadores. ............5 As diretrizes DRIVER (Digital Repository Infrastructure Version for European Research) so orientaes direcionadas a provedores de contedo que visam melhorar a qualidade dos metadados fornecidos durante a catalogao dos objetos digitais no repositrio...........................................................................................................................5 O consrcio DRIVER um projeto da Unio Europia que tem por finalidade permitir a interoperabilidade de dados da produo cientfica, por meio da constituio de infraestrutura de servios e dados. Dessa forma, permite a criao de redes que agreguem fontes de informao cientfica. A idia melhorar a interoperabilidade entre as diversas iniciativas de acesso livre de cunho cientfico....................................................................5 As diretrizes DRIVER so baseadas na utilizao de coleta automtica de metadados denominada harvesting, utilizando a camada de protocolo OAI-PMH e o uso dos padres de metadados no nvel sinttico e semntico. ....................................................................5 As diretrizes DRIVER sugerem o uso do esquema de metadados Dublin Core, com a forte recomendao de utilizao de alguns elementos e de vocabulrios controlados. Por padro, o Dublin Core possui apenas o ttulo como (quase) obrigatrio, mas, segundo as recomendaes DRIVER, metadados descritivos, como autor, idioma e direito de acesso so to importantes para a indexao que devem ser considerados como obrigatrios e devem merecer ateno especial, as quais so descritas no presente documento. .............5 3. Alteraes .......................................................................................................................6 A Figura 1 apresenta a tag <form-map>, indicando que h somente um formulrio de entrada, denominado traditional. Esse o formulrio padro que atende a todas as colees (indicado no qualificador collection-handle). Caso uma coleo possua um formulrio distinto, deve-se indicar nessa tag.................................................................7 3.2. Campo idioma.......................................................................................................8 3.2. Campo tipos de registros....................................................................................11 3.3. Campo direitos de acesso...................................................................................14 4. Procedimentos para efetivar as alteraes.....................................................................17 5. Outras informaes.......................................................................................................18 5.1. Validador ..............................................................................................................18 5.2. Identificao de adequao Selo.........................................................................19 5.3. Comandos para adequar registros existentes..........................................................20 6. Referncias ...................................................................................................................23

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

Lista de Figuras
1. Introduo......................................................................................................................4 2. Diretrizes DRIVER.........................................................................................................5 H vrias iniciativas que coletam e indexam documentos cientficos no mundo. No Brasil, temos a SciElo (Scientific Electronic Library Online) que agrega diversos peridicos cientficos, a BDTD (Biblioteca Digital de Teses e Dissertaes), entre outros. Todos esses servios possuem padres que permitem a interoperabilidade de metadados, facilitando o processo de indexao e a possibilidade de gerao de indicadores. ............5 As diretrizes DRIVER (Digital Repository Infrastructure Version for European Research) so orientaes direcionadas a provedores de contedo que visam melhorar a qualidade dos metadados fornecidos durante a catalogao dos objetos digitais no repositrio...........................................................................................................................5 O consrcio DRIVER um projeto da Unio Europia que tem por finalidade permitir a interoperabilidade de dados da produo cientfica, por meio da constituio de infraestrutura de servios e dados. Dessa forma, permite a criao de redes que agreguem fontes de informao cientfica. A idia melhorar a interoperabilidade entre as diversas iniciativas de acesso livre de cunho cientfico....................................................................5 As diretrizes DRIVER so baseadas na utilizao de coleta automtica de metadados denominada harvesting, utilizando a camada de protocolo OAI-PMH e o uso dos padres de metadados no nvel sinttico e semntico. ....................................................................5 As diretrizes DRIVER sugerem o uso do esquema de metadados Dublin Core, com a forte recomendao de utilizao de alguns elementos e de vocabulrios controlados. Por padro, o Dublin Core possui apenas o ttulo como (quase) obrigatrio, mas, segundo as recomendaes DRIVER, metadados descritivos, como autor, idioma e direito de acesso so to importantes para a indexao que devem ser considerados como obrigatrios e devem merecer ateno especial, as quais so descritas no presente documento. .............5 3. Alteraes .......................................................................................................................6 A Figura 1 apresenta a tag <form-map>, indicando que h somente um formulrio de entrada, denominado traditional. Esse o formulrio padro que atende a todas as colees (indicado no qualificador collection-handle). Caso uma coleo possua um formulrio distinto, deve-se indicar nessa tag.................................................................7 3.2. Campo idioma.......................................................................................................8 3.2. Campo tipos de registros....................................................................................11 3.3. Campo direitos de acesso...................................................................................14 4. Procedimentos para efetivar as alteraes.....................................................................17 5. Outras informaes.......................................................................................................18 5.1. Validador ..............................................................................................................18 5.2. Identificao de adequao Selo.........................................................................19 5.3. Comandos para adequar registros existentes..........................................................20 6. Referncias ...................................................................................................................23

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

1. Introduo
A visibilidade proporcionada pelos repositrios institucionais tem sido a principal motivao de vrias instituies de ensino e pesquisa para a implementao dessa ferramenta. Estudiosos como Stevan Harnad, Eloy Rodrigues, Sely Costa, entre outros, defendem a criao e uso destes repositrios como forma de ampliar a visibilidade da produo cientfica de uma instituio. Tal visibilidade, no entanto, depende de outros fatores. O depsito de documentos eletrnicos em repositrios digitais apenas o primeiro passo. A indexao realizada por meio de outros sistemas, como o Google, acelera ainda mais o processo de disseminao dos documentos digitais. Como conseqncia de uma maior exposio, podemos verificar um aumento no prestgio da instituio e de seus pesquisadores-autores. Outro mecanismo capaz de tornar um repositrio digital mais visvel a utilizao de padres internacionais de interoperabilidade de sistemas, tais como o OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting). Esse recurso incrementa a possibilidade de recuperao dos documentos depositados, j que realizam a coleta e indexao de tipos de arquivos semelhantes, distribuindo-os para outros provedores de dados e de servios. Tais iniciativas, capazes de agregar e indexar metadados cientficos de repositrios acadmicos propagam a confiabilidade fornecida pelos repositrios e peridicos cientficos. Desse modo, possvel recuperar documentos provenientes de vrios repositrios ou peridicos a partir de um nico portal na Web.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

2. Diretrizes DRIVER
H vrias iniciativas que coletam e indexam documentos cientficos no mundo. No Brasil, temos a SciElo (Scientific Electronic Library Online) que agrega diversos peridicos cientficos, a BDTD (Biblioteca Digital de Teses e Dissertaes), entre outros. Todos esses servios possuem padres que permitem a interoperabilidade de metadados, facilitando o processo de indexao e a possibilidade de gerao de indicadores. As diretrizes DRIVER (Digital Repository Infrastructure Version for European Research) so orientaes direcionadas a provedores de contedo que visam melhorar a qualidade dos metadados fornecidos durante a catalogao dos objetos digitais no repositrio. O consrcio DRIVER um projeto da Unio Europia que tem por finalidade permitir a interoperabilidade de dados da produo cientfica, por meio da constituio de infraestrutura de servios e dados. Dessa forma, permite a criao de redes que agreguem fontes de informao cientfica. cunho cientfico. As diretrizes DRIVER so baseadas na utilizao de coleta automtica de metadados denominada harvesting, utilizando a camada de protocolo OAI-PMH e o uso dos padres de metadados no nvel sinttico e semntico. As diretrizes DRIVER sugerem o uso do esquema de metadados Dublin Core, com a forte recomendao de utilizao de alguns elementos e de vocabulrios controlados. Por padro, o Dublin Core possui apenas o ttulo como (quase) obrigatrio, mas, segundo as recomendaes DRIVER, metadados descritivos, como autor, idioma e direito de acesso so to importantes para a indexao que devem ser considerados como obrigatrios e devem merecer ateno especial, as quais so descritas no presente documento. A idia melhorar a interoperabilidade entre as diversas iniciativas de acesso livre de

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

3. Alteraes
A fim de adequar os repositrios baseados no software DSpace s diretrizes DRIVER so necessrias algumas alteraes, principlmente, nas configuraes dos elementos dos metadados, uma vez que os repositrios Dspace j possuem a camada de protocolo OAI-PMH e utilizam, por padro, o esquema Dublin Core. Em sua maior parte, as modificaes devem ser efetuadas no arquivo de configurao do formulrio de entrada: input-forms.xml. Esse arquivo possui as definies dos formulrios, campos do formulrio de entrada e listas de valores. importante que os campos dos formulrios e as listas de valores estejam em conformidade com as diretrizes DRIVER. A camada de protocolo OAI-PMH, por sua vez, deve estar operacional. Em repositrios baseados no DSpace, isso opcional. Nesse caso, a parte do sistema que permite o repositrio responder coleta de metadados deve estar ativa. Para isso, basta que o diretrio OAI esteja disponibilizada no servidor de aplicao (webapps do Tomcat, por exemplo). 3.1. Arquivo do formulrio de entrada O arquivo de configurao do formulrio de entrada o input-forms.xml, organizado hierarquicamente organizado para conter os formulrios, campos e listas de valores. Tal arquivo lido por um programa que monta os formulrios. Assim, os repositrios DSpace podem ter vrios formulrios de entrada, os quais, por sua vez, possuem vrios campos. O arquivo input-forms.xml se organiza em trs partes: as tags <formmap>, que fazem o mapeamento dos formulrios, ou seja, indica qual formulrio as colees vo utilizar; as tags <form>, que definem os formulrios e, por fim, as tags <value-pairs>, que definem as listas de valores que alguns campos possuem.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

A Figura 1 apresenta a tag <form-map>, indicando que h somente um formulrio de entrada, denominado traditional. Esse o formulrio padro que atende a todas as colees (indicado no qualificador collection-handle). Caso uma coleo possua um formulrio distinto, deve-se indicar nessa tag.

Figura 1 Detalhe do arquivo de configurao do formulrio de entrada apresentando a tag <form-maps>

A Figura 2 apresenta um recorte do arquivo input-forms.xml. A tag <form>, no caso do exemplo, define o formulrio denominado traditional. Esse formulrio possui duas pginas. Aqui, a tag <page number=1> inicia a primeira pgina. A tag <field> define os atributos de um campo. No caso, o autor.

Figura 2 Detalhe do arquivo de configurao do formulrio de entrada apresentando a tag <form>

A Figura 3 apresenta um exemplo da tag <form-value-pairs>, que cria listas de valores para campos que so preenchidos por seleo, ou seja, so campos livres. No exemplo h o incio da definio da lista common_identifiers, que indica o tipo de identificador. Deve-se, no entanto, associar uma lista a um campo e seu elemento Dublin Core (identifier).
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

Figura 3 - Detalhe do arquivo de configurao do formulrio de entrada apresentando a tag <form-value-pairs>

3.2. Campo idioma


O campo idioma tem por finalidade indicar o idioma principal do contedo do objeto digital depositado no repositrio. Seu valor escolhido a partir de uma lista, evitando a seleo de mais de uma opo (Figura 4)

Figura 4 Detalhe do formulrio de entrada (em XMLUI), apresentando o campo idioma

Caso o campo idioma no se aplique ao objeto digital (caso de arquivos multimdia e imagens), deve-se selecionar a opo N/A (no aplicado). Por outro lado, se no constar na lista, deve-se selecionar Outros. As opes podem ser alteradas, bem como possvel adicionar ou trocar a ordenao dos idiomas, de acordo com a necessidade do gestor do repositrio.
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

No se trata de um campo obrigatrio, por padro, mas fortemente recomendvel que o idioma seja preenchido por auxiliar na descrio do objeto digital. Para adequao ao padro de diretrizes DRIVER, o campo idioma no precisa ser alterado, apenas os valores armazenados no banco de dados, que devero seguir a norma ISO de trs caracteres. Por padro, o DSpace adota a norma ISO 639-1 de dois caracteres, sendo pt para o idioma Portugus. Assim, basta alterar os valores ISO 639-1, de dois caracteres, para a ISO 639-3 de trs caracteres (por para portugus). A Figura 5 mostra uma definio do campo idioma, onde se pode verificar as tags que definem esse campo. Nota-se que o valor false indicado na tag <repeatable> indica que este no um campo repetitivo. Tambm observa-se que o campo no foi definido como de preenchimento obrigatrio, uma vez que a tag <required> est vazia. As tags <label> (rtulo) e <hint> (dica) devem ser alteradas para adequar-se ao tipo de discurso da instituio.

Figura 5 Detalhe do arquivo do formulrio de entrada, apresentando as definies do campo idioma

Uma vez que os valores atribudos ao campo idioma so prdeterminados, trata-se de um menu dropdown, com valores indicados pela tag <input-type>. Os valores devem ser definidos na lista common_iso_language,
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

representados em outra parte do arquivo de configurao do formulrio de entrada (Figura 6).

Figura 6 Detalhe do arquivo do formulrio de entrada, apresentando a lista de idiomas

As alteraes devem ser feitas nessa lista, trocando os valores (tags <stored-value>) de dois para trs caracteres. Por padro o DSpace usa a norma ISO 639-1 de dois caracteres com definio de regio. Para adequarmos o repositrio s diretrizes DRIVER, deve-se adotar a norma ISO 639-3 de trs caracteres. Assim, no caso do idioma Portugus, teramos o valor por em vez do valor pt. Deve-se ter cuidado de preencher o valor exato dos cdigos. Para isso, recomenda-se recorrer lista da ISO 639-3 no site <http://www.sil.org/iso6393/codes.asp>. Esses cdigos serviro para padronizar os valores do campo idioma que ser reconhecido automaticamente pelos programas de validao.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

10

3.2. Campo tipos de registros


O campo de tipos de registros tem por finalidade identificar o tipo principal do contedo do item a ser depositado (Figura 7). Geralmente um campo em que se pode selecionar o valor em uma lista. Em alguns casos, pode-se selecionar mais que um valor, pois o item pode ser composto por mais que um objeto digital.

Figura 7 Detalhe do formulrio de entrada (em XMLUI), apresentando o campo tipo

Assim como idioma, esse tambm no um campo obrigatrio, mas fortemente recomendvel que seja selecionado um valor. A identificao do tipo de documento qualifica o objeto digital, permitindo uma possvel classificao. A identificao do tipo de documento, tambm possibilita a criao de filtros que ajudam na recuperao dos documentos. Uma definio padro para o campo tipo (Figura 8), apresenta a possibilidade do campo ser repetitivo, com o valor true na tag <repeatable>. Nota-se que a mensagem colocada na tag <hint> deve ajudar ao usurio em relao ao preenchimento do campo. A tag <required> sem contedo revela que este no um campo obrigatrio.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

11

Figura 8 Detalhe do arquivo do formulrio de entrada, apresentando as definies do campo tipo

Pela tag <input-type> verifica-se que este um campo que assume valores no formato dropdown e que, em conjunto com a tag <repeatable>, apresenta-se com formato diferenciado se a tag <repeatable> tivesse o valor false (como no campo idioma). Os valores desse campo devem estar declarados na lista denominada common_types, definida em outra parte desse arquivo de configurao do formulrio de entrada (Figura 9).

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

12

Figura 9 Detalhe do arquivo do formulrio de entrada, apresentando a lista de tipos de documentos

Para adequao s diretrizes DRIVER os valores do campo tipo devem contemplam apenas os tipos de documentos cientficos. Por esse motivo, a lista composta por um vocabulrio controlado, com tipos reconhecveis automaticamente pelos programas validadores. Entretanto, a presena do valor outros permite o depsito de documentos que no esto contemplados na lista. Deve-se, contudo, ter cuidado para que os outros tipos de documentos no sejam muito representativos, pois isso descaracterizaria o repositrio cientfico.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

13

3.3. Campo direitos de acesso


O campo direito de acesso no um campo padro, mas precisa ser adicionado ao formulrio de entrada para revelar o tipo de acesso permitido ao contedo do item. Esse campo importante, pois est de acordo com o movimento de acesso livre e das diretrizes DRIVER. Por no ser um campo padro e precisar ser adicionado, o melhor que se crie um campo em que se selecione o valor. Essa opo impede a entrada de valores que no sejam reconhecidos pelos validadores DRIVER, alm de facilitar o preenchimento. A Figura 10 apresenta um exemplo do campo direitos de acesso com essa opo.

figura 10 - Detalhe do formulrio de entrada (em XMLUI) , apresentado o campo direito de acesso

A Figura 11 apresenta um exemplo de como criar o campo direito de acesso. Note que o elemento Dublin Core relacionado a esse campo o dc.rights, pelas tags <dc-schema> e <dc-element>. Salienta-se que esse elemento no foi qualificado, pois a tag <dc-qualifier> est vazia. Apesar de no ser um campo obrigatrio e nem repetitivo, (tags <repeatable> e <required>), recomendase o seu preenchimento.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

14

Figura 11 Detalhe do arquivo do formulrio de entrada, apresentando as definies do campo direito de acesso

Os valores do campo direito de acesso devem estar de acordo com o vocabulrio controlado das diretrizes DRIVER. Assim, esses valores esto em uma lista denominada common_rights, definida na tag <input-type>. Nota-se, no entanto, que o campo do tipo dropdown e no repetitivo, semelhante ao campo idioma. A Figura 12 apresenta um exemplo da lista common_rights. A tag <valuepairs> define o nome da lista (value-pairs-name) e qual o elemento Dublin Core associado lista dc-term. Para cada valor da lista necessrio um conjunto de tags, hierarquicamente dependente da tag <pair>. O valor apresentado deve ser colocado na tag <display-value>, enquanto o valor armazenado na tag <storedvalue>.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

15

Figura 12 Detalhe do arquivo do formulrio de entrada, apresentado a lista de direitos de acesso.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

16

4. Procedimentos para efetivar as alteraes


Para efetivar as alteraes efetuadas devem ser executados alguns procedimentos que validam as alteraes e as tornam permanentes. Esses procedimentos so rotineiros na manuteno do DSpace e devem ser rigorosamente executadas conforme os padres da instalao. Assim, pode haver algumas diferenas dependendo da instalao e verso. De modo geral, a manuteno em sistemas DSpace devem ser executadas em 3 passos: 1. A alterao Nesse passo so efetuadas as alteraes propriamente ditas no arquivo de configurao do formulrio de entrada input_forms.xml. 2. Procedimentos ps-alterao Nesse passo h duas etapas: a verificao de pendncias (pela execuo do comando mvn package) e a compilao (pela execuo do comando ant init_configs). 3. Reinicializao do servidor de aplicao Para refletir as modificaes necessrio que o servidor de aplicao (o mais comum no caso do DSpace o Tomcat) seja reinicializado para recarregar o sistema.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

17

5. Outras informaes
A adequao s diretrizes DRIVER tem por objetivo a normalizao do contedo de alguns metadados. Essa adequao, no entanto, pode ocorrer em qualquer estgio do repositrio, desde a sua criao at a fase em que est totalmente implementado. Nesse ltimo caso, se faz necessrio alguns ajustes para adequao dos depsitos existentes. O presente documento apresenta uma forma de adequao, que no a nica, mas que adequa o formulrio e os contedos dos metadados. Outra forma, por exemplo, seria apenas adequar a resposta ao harvesting, sendo que os dados e o formulrio no seriam alterados. Independente da forma de adequao alguns procedimentos facilitam no processo de adequao s diretrizes DRIVER. Importante, tambm, a identificao dos repositrios que j se adequaram. Essa seo traz informaes sobre esses tpicos.

5.1. Validador
Uma ferramenta til no processo de adequao s diretrizes dirver o validador. Um programa online que verifica a adequao do acervo, do repositrio, s diretrizes driver. Dessa forma, apia na implementao das diretrizes, ao analisar os metadados do acervo, e, relatar o quantitativo de registros vlidos em relao s diretrizes driver. Essa facilidade foi desenvolvida, originalmente, pelo projeto DRIVER e, posteriormente, traduzida e disponibilizada em lngua portuguesa pelo projeto RECAP. Pode ser acessa em http://validador.rcaap.pt/, de forma gratuita. No entanto, necessrio cadastrar sua URL de OAI. O cadastramento para validao simples e basta preencher um formulrio (figura 13). Cabe notar que o cadastramento requerido apenas na primeira validao, mesmo que as informaes possam ser alteradas posteriormente. Das outras vezes, basta recarregar as informaes, trocar algumas se preciso e validar.
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

18

Figura 13 Detalhe da pgina do validador com o formulrio de cadastro

A confirmao e o resultado so enviados para o email fornecido no cadastramento, em forma de um link. Ou seja, recebe-se um email com um link que remete a pgina de validao, com um relatrio sobre a adequao do acervo s diretrizes. Para cada validao, recebe-se um email enviando a uma pgina diferente.

5.2. Identificao de adequao Selo


A adequao s diretrizes, por outro lado, necessita de identificao, que indique a condio do repositrio. Para tanto, recomenda-se colocar um selo, uma identificao, do DRIVER na pgina inicial do repositrio para queles repositrios que tenham se adequado s diretrizes. Essa identificao, com um selo, pode ser vista no repositrio da Universidade Tecnolgica Federal do Paran UTFPR (figura 14). Nesse caso, o selo foi colocado, ao final da pgina juntamente com outros selos de adequao
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

19

(padro w3 e creative commons). Assim, no rodap, esto as orientaes seguidas por esse repositrio.

Figura 14 Detalhe da pgina inicial do RIUT (repositrio da UFTPR), com o selo de adequao s diretrizes driver.

5.3. Comandos para adequar registros existentes


A adequao em repositrios que j possuam acervo requer, no apenas, a alterao do formulrio de entrada, mas, principalmente, a correo dos valores dos metadados existentes. Essa alterao, do contedo de alguns metadados, pode ser feita de duas formas, pela interface ou por alterao direta do banco de dados 5.3.1. Adequao das informaes via Interface. A adequao do contedo dos metadados, via interface, funciona como a alterao do Item. Assim, necessitar de permisso de administrador para faz-lo. Nesse caso, basta acessar o Item que deseja ajustar e clicar em alterar o item. Note que essa opo (figura 15) aparece somente para os usurios que possuem permisso de administrador, podendo ser do repositrio, comunidade ou coleo.

figura 15 detalhe da pgina de apresentao do Item, com a opo de alterar


Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

20

A alterao do item d-se de duas formas, a alterao de contedo e a incluso de novo campo. Ou seja, se o campo j existir e pretende-se apenas altera o valor inserido no processo de submisso, uma alterao. Por outro lado, se o campo de metadado no existir, deve-se inserir tanto o campo de metadado quanto o valor. Alterar o valo de um campo de metadado sobrescrever o contedo. Basta, assim, localizar o campo de metadado deseja e sobrescreve o novo valor. Nota-se que o valor do campo de metadado apresentado em um caixa com a possibilidade de sobrescrio (figura 16). Depois de sobrescrever, basta clicar no boto atualizar ao final da pgina.

Figura 16 detalhe da pgina de alterao do item

Incluir um novo campo, por sua vez, preciso utilizar o formulrio ao final da pgina (figura 17). Primeiro, deve-se selecionar da lista qual o metadado que se pretende incluir. Aps a seleo, basta incluir o valor desejado. Depois de concluir a insero, basta clicar no boto atualizar no final da pgina.

Figura 17 detalhe da pgina de alterao do item, apresentando o formulrio para incluir novo metadado.

5.3.2. Alterao direta do banco de dados A alterao direta ao banco de dados, por um lado, mais eficiente, por outro, mais radical. Pode-se, em um comando, alterar todos os campos que deseja alterar, mas pode comprometer o banco em caso de erros ou falha. Nesse
Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

21

contexto essa opo deve ser efetuada por profissional que conhea a estrutura do banco de dados do DSpace e domine questes do PostGreSql. Essa alterao pode ser efetuada, com maior facilidade, atravs de gerenciadores grficos de banco de dados, como o PHPPgAdmim. No apenas para alterar via browser, mas facilita na emisso dos comandos SQL. A instalao de ferramentas grficas de gerenciamento de banco de dados facilita, inclusive em questes de cpias de segurana. A alterao direta no banco de dados muito particular a cada caso, pois depende dos valores existentes, que podem assumir valores distintos a cada instituio. O exemplo seguinte (contribuio de Marcio Ribeiro Gurgel do Amaral) apresenta um comando SQL que altera todos os registros de idioma, do padro ISO com dois caracteres com regio (pt idioma, BR regio) para o padro com trs letras. UPDATE metadatavalue SET text_value = 'POR' WHERE /** Filtra metadados do tipo "idioma" **/ metadata_field_registry_id = 99 /** Substituir pelo metadado de idioma, ser o ID da tabela metadatafieldregistry **/ AND /** Filtra metadados com valor PT fora do padro DRIVER **/ text_value = 'PT_BR' /

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

22

6. Referncias
DRIVER, Directrizes driver 2.0: Directrizes para fornecedores de contedos - Exposio de recursos textuais com o protocolo OAI-PMH. Verso portuguesa, 2008.

Instituto Brasileiro de Informao em Cincia e Tecnologia IBICT Laboratrio de Metodologias de Tratamento e Disseminao da Informao SAS Quadra 05 Lote 06 Bloco H 2 andar | Cep: 70070-912 - Braslia / DF | Telefone: +55 61 3217 6151

23

You might also like