TEXTOS GERAIS


  • Textos Gerais

PLANEJAMENTO DE BIBLIOTECAS DIGITAIS: ALGUMAS CONSIDERAÇÕES

As primeiras considerações sobre o conceito de bibliotecas digitais foram empregadas por Vannevar Bush, um engenheiro norte-americano que em 1945 publicou um artigo na revista Atlantic Magazine onde apresentava a ideia do Memex (Memória Expandida). Segundo Bush, o Memex seria uma biblioteca privativa onde cada pessoa guardaria suas informações e teria acesso a elas de qualquer lugar, em qualquer momento, de acordo com sua necessidade informacional. Evidentemente, naquela época não existiam nem a definição nem o conceito de biblioteca digital, mas a ideia da funcionalidade permite considerar que esta foi a primeira menção a este tipo de serviço de informação. Desde então uma série de artigos foram publicados, discorrendo sobre os conceitos de biblioteca eletrônica, virtual, digital e híbrida. Este artigo visa contribuir com a discussão sobre o tema abordando, contudo, uma questão que muitas vezes não é discutida: a importância e as etapas de planejamento que devem ser definidas para implantar uma biblioteca digital. Para esta empreitada serão analisados critérios estudados pelo ECM (Enterprise Content Management) e GED (Gerenciamento Eletrônico de Documentos).

 

Biblioteca Digital: ultrapassando os limites físicos

 

A importância de gerir bibliotecas digitais é uma realidade. Por este instrumento é possível disponibilizar íntegras aos usuários, ampliando o acesso aos registros e demolindo as paredes da biblioteca física, abrindo possibilidades de localização de informações em qualquer lugar.

 

Uma biblioteca digital é composta por documentos digitais de formatos variados, não se limitando a conteúdos textuais, mas transitando livremente por gravações de som e vídeo, imagens (estáticas ou em movimento), páginas de navegadores, programas executáveis, páginas de estilo e quaisquer outros documentos que sejam de interesse da comunidade usuária. Os documentos em formato eletrônico estão cada vez mais presentes nos acervos, possibilitando um novo relacionamento entre as bibliotecas e seus usuários. Além de ser uma ferramenta para acesso e divulgação de documentos, uma biblioteca digital também advém dos conceitos de criação e compartilhamento de informações (SAYÃO, 2009, p.8).

 

A implantação de um projeto de biblioteca digital representa uma nova forma de tratamento dos acervos reunidos nas instituições. Organizar as informações de forma a permitir a consulta - independente de localização física ou geográfica dos pesquisadores e dos documentos - amplia o alcance da biblioteca e, consequentemente, da instituição mantenedora. A possibilidade de aliar a oferta de conteúdos com práticas de ensino representa um avanço tecnológico e educacional, consolidando a trajetória de instituições e preparando-as para atuar no ensino a distância, permitindo aos alunos e professores o acesso a mais variada gama de recursos até então inimagináveis pelas barreiras físicas e geográficas. O modelo digital representa também um melhor investimento em acervos, evitando a duplicidade de documentos uma vez que eles estão disponíveis em seus locais de origem. Em suma, as bibliotecas digitais vieram para transformar a forma como são vistos os acervos, ampliando seu volume, alcance e comunidade atendida, permitindo acesso a conteúdos e serviços, contribuindo, desta forma, com a preservação de documentos, a disseminação das informações e a divulgação do conhecimento.

 

Mas com todas essas possibilidades, surgem diversas dúvidas: como planejar uma biblioteca digital? O que fará parte do acervo? Como desenvolver a coleção? Selecionar arquivos digitais ou que necessitam de captura? O que será digitalizado? Como realizar a digitalização? Como definir a seleção e a prioridade para disponibilização? Este documento visa discorrer sobre estes (e outros) temas correlatos, de forma a apresentar ao bibliotecário subsídios para o planejamento para construção de uma biblioteca digital.

 

Etapas de planejamento

 

Para a criação de uma biblioteca digital é fundamental traçar um planejamento que deve englobar as políticas institucionais, de digitalização, de preservação digital, infraestrutura necessária e serviços que serão disponibilizados. Sem definir estas questões, um projeto de biblioteca digital fica fragilizado, tendo seu êxito ameaçado ou então o investimento descontinuado. Neste artigo será apresentada a questão da política de digitalização, com as variáveis que podem ocorrer durante este processo.

 

Políticas de digitalização

 

Os documentos eletrônicos que compõem uma biblioteca digital são formados basicamente pela produção institucional, conteúdo que já nasceu em formato digital, documentos que foram ou serão digitalizados, obras em domínio público e por conteúdo licenciado. É fundamental traçar uma política de formação e manutenção da coleção digital, de forma a impedir que o acervo – armazenado em servidores, na nuvem, em HD externo ou outros suportes – não esteja de fato alinhado com os interesses da instituição e coerente com as políticas que foram definidas.

 

A seleção de quais documentos irão compor o acervo da biblioteca digital mostra-se um grande desafio. Tanto os analógicos que deverão ser digitalizados, como os documentos que já nasceram digitais devem ser analisados e selecionados por critérios bem definidos para inclusão e manutenção no acervo. Abordando os documentos em papel (ou outras mídias de suporte físico), observa-se a importância em identificar quais documentos justificam a captura da imagem – tanto através de scanner como por fotografia –, sua conversão para texto, de forma a permitir a consulta por texto completo, o formato de arquivo que será utilizado, a resolução adotada na captura, o padrão de cores empregado e tantos outros critérios que podem passar despercebidos num primeiro momento. A simples preocupação com o preparo físico que deve ser empregado antes de realizar a digitalização deve ser calculado, de forma a evitar que uma atividade corriqueira impacte o andamento de um projeto e resulte em atrasos na entrega de conteúdos.

 

Uma vez definido o critério de seleção, é necessário estabelecer a estratégia de captura que será adotada. Esta estratégia será definida de forma alinhada com a política institucional e de acordo com a demanda informacional dos usuários, internos ou externos. Estes critérios podem ser:

 

a)    Estado de conservação: obras que apresentam grande fragilidade física serão priorizadas para digitalização;

b)    Data de publicação: estabelecimento de ordem cronológica – ascendente ou descendente – para realizar a captura;

c)     Necessidade informacional do usuário. Temas que são demandados pela comunidade atendida;

d)    Fatores políticos: determinação ou anseio de informação por parte dos patrocinadores do projeto da biblioteca digital;

e)    Suporte: definir a captura ou geração dos arquivos por tipo de suporte documental, visto que cada tipo pode demandar uso de equipamento diverso;

f)     Outros fatores

 

De acordo com a necessidade informacional, uma estratégia deverá ser adotada, porém pode ocorrer de algumas estratégias serem estabelecidas de forma simultânea.

 

Ao decidir o que será digitalizado e em qual ordem, partimos para a escolha da forma de captura. Apesar de muitas pessoas acreditarem que a questão mais importante de um processo de digitalização é a aquisição de um scanner, isto não é uma realidade. Não é possível definir quais ferramentas (hardware e software) serão utilizadas antes de estabelecer qual a necessidade, de acordo com o tipo de material a ser trabalhado e a demanda apresentada. A definição da forma que será adotada para capturar uma imagem pode ser definida por diversos critérios:

 

a)    Tipo de suporte

b)    Tamanho dos suportes

c)     Fragilidade e estado de conservação do material a ser digitalizado

d)    Velocidade na geração das imagens

e)    Etc.

 

Ao identificar os tipos de suportes existentes no acervo serão definidos quais recursos serão necessários para o projeto. Se a coleção for constituída em sua maioria por documentos em papel, a escolha pode ser por um scanner de mesa, tração ou por captura fotográfica. Se o material estiver encadernado ou for frágil, o uso de scanners de tração deverá ser dispensado, pois ao submeter o material ao equipamento corre-se o risco de inutiliza-lo definitivamente. Caso a instituição possua documentos com tamanhos diferenciados ou fora do padrão, será necessário utilizar equipamento compatível e que permita a captura, sem a utilização de recursos de compressão ou montagem de diversos arquivos digitais para formar uma imagem. Se o acervo é composto por gravações de som ou de vídeo, será necessário o emprego de equipamentos e tecnologia específicos para realizar a digitalização e o tratamento necessário.

 

Outra questão que deve ser analisada é sobre a aquisição de equipamentos de captura ou a decisão de contratação de empresa terceirizada para realização da empreitada. Ambas as decisões devem levar em conta uma série de variáveis. Se a instituição optar por adquirir o equipamento, além dos custos, é necessário preocupar-se com a importação – a maioria dos scanners é importada – e a demora no recebimento do produto. Além disso, é fundamental investir na capacitação da equipe que utilizará o equipamento. Os riscos de falha no hardware por má utilização são uma variável grande, sem contar que sem capacitação a produtividade da equipe demorará a alcançar os níveis desejados. Os custos de manutenção preventiva, reposição de peças e de reparos também devem ser apurados, de forma a não comprometer o orçamento do projeto.

 

Existem questionamentos que são feitos pelos gestores em relação à mão de obra. Ela pode ser composta por pessoas da equipe que foram deslocadas ao projeto – com carga horária completa ou parcial -, por novas contratações – efetivas ou temporárias – ou por contratação de serviço terceirizado. Caso seja definido que a equipe será deslocada, deve-se considerar que a atividade que era desempenhada por estas pessoas não apresentará mais o mesmo rendimento, visto que, ou estão completamente envolvidas no projeto de digitalização e não exercerão mais as atividades anteriores ou, a diminuição da carga horaria impactará a produtividade das funções originais. Neste caso, é importante avaliar quem ficará responsável pela execução do trabalho que era desenvolvido e quais os custos desta decisão. Ao optar por contratação e formação de nova equipe para o projeto é necessário computar os encargos de pessoal e demais benefícios, questões que costumam pesar bastante no orçamento do projeto. Para o caso de contratar equipe temporária, deve-se pensar na renovação dos integrantes e dos custos de capacitação constante, de acordo com a rotatividade da mão de obra. Caso seja definido que uma empresa terceira será contratada para realizar o trabalho, algumas considerações são importantes, suplantando, inclusive, as questões financeiras. A digitalização será realizada no ambiente onde está o acervo ou a empresa fará a retirada do material? Caso o trabalho seja realizado in company, será necessário definir um local que comporte os equipamentos e os funcionários da empresa contratada. O material a ser digitalizado deverá ter seu acesso controlado, estabelecendo fluxos de lotes de documentos que são retirados e que retornam ao acervo após a digitalização, aferindo sua integridade física e organização iniciais, bem como os cuidados necessários à manipulação física dos mesmos, principalmente se forem documentos raros, únicos, sigilosos ou notáveis. Em contrapartida, se o material for retirado para digitalização em ambiente externo, é necessário ter um rigoroso controle dos documentos que saíram e que retornaram. Em alguns casos pode ser necessária a contratação de seguro para retirada de acervo de seu local de origem, além da elaboração de laudos de saída e entrada dos materiais. Os riscos de transporte devem ser bem analisados pelos gestores. Por mais caro que seja um scanner, ele é um equipamento que tem um preço, enquanto acervos têm valor. Se o valor do acervo não é tão alto a ponto que, se o material for perdido o prejuízo não será tão grande, recomenda-se retomar o processo de seleção de quais documentos devem ser digitalizados, pois é nítido que se um item do acervo pode ser perdido sem prejuízo à instituição, é sinal que este material não agrega valor ao conjunto e deve-se questionar se ele, de fato, necessita ser digitalizado.

 

Após a definição de equipamento e equipe, é necessário estabelecer quais critérios de digitalização serão empregados no projeto. Mais do que detalhes técnicos, as definições adotadas impactarão em todo processo ao determinar quanto de espaço de armazenamento será necessário para comportar o acervo e seu crescimento, as necessidades de recuperação, o tempo investido para manipular os arquivos digitais, entre outros quesitos. Ao estabelecer a política de digitalização é necessário algumas definições como:

 

a)    Resolução da captura

b)    Formatos utilizados

c)     Uso ou descarte de informações de cor

d)    Uso de ferramentas de tratamento de imagem

e)    Uso de ferramenta para converter as imagens em texto (OCR – Optical Character Recognition)

f)     Padrão que será utilizado para nomear os arquivos

g)    Etc.

 

Quando falamos em capturar a imagem de documentos em papel para transformá-los em digitais, é importante adotar critérios sobre quais itens necessitam e justificam esta conversão, afinal este processo é moroso e caro. De acordo com a necessidade de acesso à documentação deverão ser adotadas estratégias de captura das imagens. A escolha da captura do documento como imagem, como imagem convertida em texto para permitir a busca por texto completo, em cores, preto e branco ou tons de cinza, a resolução estipulada etc. – são detalhes que impactam, em muito, o desenvolvimento de um projeto, pois, de acordo com a forma que o material foi digitalizado, o tamanho do arquivo apresentará grandes variações e não é possível mensurar o espaço de armazenamento que será necessário para guarda dos objetos digitais sem ter uma estimativa do tamanho médio dos arquivos multiplicado pela quantidade de arquivos que serão armazenados.

 

A resolução empregada na captura se por um lado determina a qualidade da imagem digitalizada, por outro pode representar arquivos grandes e pesados, digitalização lenta e necessidade de muito espaço para armazenamento, além de dificultar o acesso à mídia pelo usuário. É necessário estabelecer um critério de resolução que não comprometa o acesso e absorção do conteúdo por baixa qualidade, mas que também não exija altos investimentos em servidores para armazenamento dos objetos digitais. Tampouco é interessante realizar uma captura simples, com baixa resolução para não ocupar muito espaço de armazenamento e fazer uma nova digitalização quando esta imagem for necessária com mais detalhes. Ao adotar esta política, é importante ter ciência que o original deverá ser retirado de seu espaço de guarda e exposto a nova manipulação, ato este que pode comprometer a preservação física do mesmo, de acordo com sua fragilidade. Esta política também impactará o desenvolvimento dos trabalhos, pois retornar a um documento que já foi digitalizado é um retrabalho!

 

É fundamental estabelecer um tamanho médio dos arquivos digitais que comporão a biblioteca digital e dimensionar o espaço necessário de acordo com a quantidade de documentos existentes hoje, daqui há cinco e dez anos. Sem estes cálculos não é possível iniciar a formação do acervo, pois não é possível dimensionar o investimento que deverá ser feito em hardware para armazenar os documentos existentes. A questão sobre digitalizar imagens em preto e branco, tons de cinza ou em cores também impactará o espaço de armazenamento utilizado. Os arquivos coloridos são mais pesados que os documentos em tons de cinza e que as imagens em preto e branco. Evidentemente não é possível estabelecer que todos os documentos serão digitalizados em preto e branco para promover a economia e racionalização do armazenamento. Este tipo de determinação sem análise de cada caso pode representar na geração de arquivos digitais ilegíveis, caso a obra digitalizada seja repleta de gráficos coloridos onde o elemento cor determina a identificação das informações representadas.

 

Outra consideração importante está relacionada com formatos. Cada tipo de arquivo tem um formato e ocorrem variações de acordo com o tipo de material como:

 

a)    Texto: rtf, doc, docx (Windows), pdf, txt etc.

b)    Áudio: wav (Windows Media Auto), mp3, mp4 (iTunes), RA (Real Player), MID etc.

c)     Vídeo: AVI, WMA (Windows Media Player), MP4, Rmvb (Real Media), Mov (Quicktime) etc.

d)    Imagens: jpeg, tiff, gif, raw, cdr, bmp etc.

 

A escolha dos formatos que serão adotados para cada tipo de arquivo deve considerar que o usuário tenha acesso a estes aplicativos em seu computador, caso contrário não será possível acessá-los. A recomendação é que sejam adotados formatos de ampla utilização no mercado, sem que sejam proprietários, e que permitam a conversão, caso seja mandatória a migração de formato dos arquivos no futuro, por questões de atualização do software ou de acordo com os critérios de preservação digital que vierem a ser adotados no projeto. Cada formato apresenta um fator de compressão – questão esta que também impacta o espaço de armazenamento. Um arquivo no formato RAW ou TIFF contem mais detalhes da imagem digital, porém são arquivos grandes e que necessitam de programas editores de imagens específicos para acessa-los. Já os arquivos no formato JPEG, apesar de terem menos informação, pois uma quantidade de pixels foi descartada no momento da compressão, permitem a manutenção de imagens com qualidade, com arquivos menores, se comparados com arquivos com outras extensões. Para textos (e inclusive imagens) recomenda-se a adoção do padrão Acrobat (pdf), formato amplamente utilizado e cujo leitor é gratuito.

 

Ao realizar uma digitalização é importante utilizar algum recurso de tratamento de imagem, visto que podem existir imperfeições no documento original que podem ser corrigidas digitalmente. Evidentemente que ao tratar imagens são empregadas ferramentas de manipulação que exigirão a compra de licença de software e capacitação da equipe para operá-las. Também recomenda-se um cuidado no momento da captura de forma a minimizar o emprego destas ferramentas além do necessário. Pequenos cuidados como alinhar o documento na superfície do scanner, limpeza da tela para retirada de impurezas (muitas vezes deixadas pelo material que foi digitalizado), marcas de dedos no vidro por manipulação inadequada e outros cuidados devem ser tomados. Não é interessante descuidar do momento da captura por utilizar ferramentas para manipular as imagens. O tratamento de imagens é uma atividade que exige grande preparo técnico e tempo para aplicação dos recursos, além de exigir computadores com alta capacidade de processamento.

 

Com a geração do arquivo digital, é chegado o momento de aplicar ferramentas para converter as imagens geradas em textos pesquisáveis. Isto apenas é possível com a utilização de softwares de OCR, que identificam as imagens das letras e as converte para a forma de texto. Caso não seja empregado o OCR, não será possível realizar pesquisas de texto completo no documento e a recuperação deverá ocorrer apenas através de metadados. Dependendo do tipo de acervo esta decisão será essencial, pois muitas vezes os detalhes dos documentos é que revelam sua pertinência. A utilização de ferramentas de OCR, por mais avançadas que sejam não alcançam a eficiência de 100% de precisão e exigem uma revisão das conversões realizadas. Com o termino da digitalização e conversão das imagens em texto, passa-se a fase do controle de qualidade das imagens capturadas, aferindo por amostragem se o material atende aos requisitos de qualidade que foram estabelecidos, validando os objetos inseridos no servidor ou repositório, de forma a manter apenas documentos íntegros, legíveis e pesquisáveis.

 

No momento de salvar os objetos digitais nos repositórios é necessário definir como será a nomeação dos arquivos gerados. Apesar de parecer uma questão menor, o não estabelecimento de critérios para escolha do nome do arquivo pode resultar em uma grande dificuldade para identificar os objetos digitais no servidor e relaciona-los com os metadados. Ao imaginarmos um grande lote com centenas de milhares de objetos digitalizados, identificados apenas por sequência numérica, sem que tenham sido demarcados os intervalos e a compatibilidade com os objetos originais, ficará muito difícil a identificação das imagens, sendo necessário abrir cada arquivo para verificar qual é o documento e relacioná-lo com o conjunto de metadados existentes. Vários critérios podem ser adotados para nomear objetos digitais:

 

a)    Número de tombo;

b)    Código de barras;

c)     Data e hora de captura da imagem, no formato ISO 8601, por exemplo;

d)    Nome do operador;

e)    Data da publicação;

f)     Título do documento;

g)    Autores;

h)    Etc.

 

Diversos critérios podem ser adotados. O melhor é o que permita sua rápida identificação, de acordo com a forma como são identificados ou como podem ser relacionados aos metadados de forma automática ou semi automática. Caso as imagens digitalizadas sejam de registros já inseridos em banco de dados, é interessante estipular o nome do arquivo de forma que possa ser vinculado ao objeto digital de forma dinâmica, sem a necessidade de anexar o arquivo a cada registro existente.

 

O planejamento de uma biblioteca digital exige a definição de uma série de procedimentos e processos, de forma a computar o desenvolvimento do trabalho e a realização das tarefas dentro do cronograma que foi estabelecido para oferta de conteúdo digital. Iniciar uma biblioteca digital sem atentar-se a estes detalhes pode comprometer o projeto já em sua fase inicial, pois não é possível começar a captura de imagens sem que seja estabelecido como será esta digitalização, o formato dos arquivos, a qualidade da imagem, a forma de busca e, finalmente, o acesso ao usuário final. Por ser um investimento alto e constante, afinal a aquisição, manutenção e atualização de licenças de softwares e hardware necessitam de atualização constante, outros custos devem ser mensurados, inclusive como forma de elaborar um relatório de ROI (Return on Investment, Retorno sobre Investimentos), de forma a entregar aos patrocinadores do projeto a contrapartida sobre a utilização do serviço de informação. Os investimentos em contratação de pessoal, espaço para armazenamento de arquivos, banda larga para trafegar os arquivos digitais, manutenção de equipamentos ou contratos com empresas terceiras devem ser colocados na balança, pois tanto os custos diretos quanto os indiretos devem ser estimados e calculados, pois sem eles não é possível a concretização do projeto. A frequência de uso da biblioteca digital deve ser monitorada para que seja possível utilizar-se de indicadores que auxiliarão na análise de custo x benefício. A biblioteca digital é um projeto de longo prazo, que necessita planejamento apurado e monitoramento por parte dos gestores, caso contrário não será possível aferir o grau de utilização dos recursos disponibilizados e de satisfação do usuário, inclusive como elementos para identificação de demandas de oferta de novos produtos.

 

Referências

 

ASSOCIATION FOR INFORMATION AND IMAGE MANAGEMENT. ECMP: AIIM practitioner. [2008]. 1 apostila (158 p.)

 

BUSH, Vannevar. As we may think. The Atlantic Monthly, n. 176, p. 101-108, July 1945. Disponível em: http://www.notredame.ac.jp/ftplib/Articles/CMC/bush45.txt>. Acesso em: 10 Out 2012.

 

MARQUES, Eliana de Azevedo. A nova biblioteca: o papel e o digital. Revista Usp, São Paulo, n. 80, p.18-27, fev. 2009.

 

MORVILLE, Peter & ROSENFELD, Louis. Information architecture for the world wide web. 3. ed. Sebastopol (CA) : O’Reilly, 2006. 504 p.

 

ROSETTO, Marcia. Bibliotecas digitais: cenário e perspectivas. Revista Brasileira de Biblioteconomia e Documentação: Nova Série, São Paulo, v. 4, n. 1, p.101-130, jan./jun. 2008.

 

SAYÃO, Luis Fernando. Afinal, o que é biblioteca digital? Revista Usp, São Paulo, n. 80, p.6-17, fev. 2009.

 

Liliana Giusti Serra - Bibliotecária com especialização em Gerência de Sistemas e Serviços de Informação pela Fundação Escola de Sociologia e Política de São Paulo. Formação em ECM (Enterprise Content Management). Profissional de Informação da Prima (SophiA Biblioteca). Professora de Representação Descritiva e Tópicos modernos em Biblioteconomia do Centro Universitário Assunção (UNIFAI).

E-mail para contato: giustii@yahoo.com

Autor: Liliana Giusti Serra

   67 Leituras


author image
Seção Mantida por OSWALDO FRANCISCO DE ALMEIDA JÚNIOR

Professor associado do Departamento de Ciência da Informação da Universidade Estadual de Londrina. Professor do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília. Doutor e Mestre em Ciência da Comunicação pela ECA/USP. Professor colaborador do Programa de Pós-Graduação da UFCA- Cariri - Mantenedor do Site.