ONLINE/OFFLINE


O BIBLIOTECÁRIO DE CATALOGAÇÃO NA PERSPECTIVA DO BIBFRAME

Na coluna “O sepultamento do MARC chegou! E agora catalogadores?”, destaquei a manifestação da Library of Congress (LC) sobre a alteração dos seus sistemas catalográficos, e a substituição do Formato MARC (MAchine-Readable Cataloging) pelo BIBFRAME (Bibliographic Framework Initiative). As mudanças no âmbito catalográfico, não dependem apenas dos interesses da LC, decorrem de vários outros fatores. A própria experiência do usuário com o catálogo bibliográfico é um exemplo do gatilho da mudança, que influencia no requisito de novos recursos de pesquisa baseados no uso de linked data (dados ligados ou vinculados) e, no qual, o BIBFRAME se apresenta como alternativa para atender às necessidades futuras do usuário, melhor que o MARC.

O BIBFRAME também se propõe a explicar o linked data e os princípios do Resource Description Framework – RDF, para que bibliotecários de catalogação tenham uma melhor compreensão dos seus objetivos básicos.

Ressalte-se como fato marcante, nesta mudança de protocolo, a ocorrência em outubro de 2015, da Online Computer Library Center (OCLC), responsável pelo WorldCat, quando imprimiu e despachou o seu último lote de fichas catalográficas. Segundo comentário a época do CEO da empresa, Skip Pritchard, se continuasse com aquele procedimento, “haveria um monge fazendo caligrafia na elaboração da ficha catalográfica”. Ironicamente, ele se referia sobre a obsolescência da prática de registrar informações bibliográficas em fichas impressas, em plena era dos computadores.

Entretanto, não só os catálogos impressos ficaram obsoletos. Quando Henriette Avram (1919 – 2006) desenvolveu o Formato MARC, na década de 1960, ela traduziu o modelo de fichas para um formato processável por computadores. Décadas depois, com os registros bibliográficos nascendo digitais, surge a dúvida em relação aos OPACs necessitarem de um novo padrão. Em busca de respostas, em 2012, a LC contratou a empresa Zepheira para desenvolver o BIBFRAME. Assim, a iniciativa tornou-se um fator de mudança radical para os processos catalográficos.

Ressalte-se que, no artigo de 2002, de Roy Tennant, “MARC Must Die”, as limitações do MARC foram ressaltadas. Até por ser um padrão criado na época em que os recursos computacionais exigiam uma abordagem minimalista dos dados. O autor ressaltou, ainda, a natureza proprietária do MARC, aspecto que restringe as bibliotecas a só usar softwares de fornecedores que atendam à ambiência bibliotecária. Isso gera uma situação problemática, o uso de um padrão antiquado que promove apego a software desatualizado pela aderência ao próprio padrão. Isso torna difícil à biblioteca atender às necessidades atuais de seus clientes, via catálogo bibliográfico.

A evolução tecnológica influencia na busca por um formato catalográfico mais versátil, extensível, aberto, transparente, modular, hierárquico, granular e cooperativo. Neste contexto, estrutura-se o BIBFRAME com capacidade de ser expresso em Resource Description Framework (RDF) e Extensible Markup Language (XML), entre outras linguagens, supostamente com capacidade de atender aos requisitos anteriormente elencados.

Estudos sobre as mudanças e evoluções na catalogação, salientam a necessidade de entender duas propostas surgidas desde o desenvolvimento do MARC e que contribuem para a sua obsolescência.

A primeira proposta é o Functional Requirements for Bibliographic Records (FRBR), um modelo conceitual baseado em entidade-relacionamento, centrado no usuário e mais hierárquico do que o MARC e o catálogo de fichas. Introduz os conceitos-chave: Obra, Expressão, Manifestação e Item.

A segunda, é o Resource Description and Access (RDA), lançado em 2010, para substituir a AACR2r. Ao contrário do seu antecessor, ele contém um conjunto de vocabulários orientados à criação de dados bibliográficos para uma Web Semântica. Esses dados são estruturados para compreensão direta pelos computadores, sem ajuda de operadores humanos. Ressalte-se que o FRBR já foi absorvido pelo IFLA-LRM (Library Reference Model), também adotado pelo RDA. Portanto, mudanças sucedendo mudanças, com impacto em toda cadeia da catalogação bibliográfica; incluindo o desenvolvimento de bancos de dados para desenvolvimento de OPACs e outras bases bibliográficas.

Cenário que reforça o comentário de Amanda Sprochi, “Se quisermos que nossas coleções sejam descobertas e usadas, teremos que nos afastar do ‘registro’ bibliográfico em MARC e do modo de pensar ‘arquivo plano’ e adotar uma forma mais tridimensional de abordar os dados, que permita o compartilhamento e interoperabilidade dentro e fora da comunidade bibliotecária”.

Entretanto, no relatório sobre os testes do RDA, divulgado pelo US RDA Test Coordinating Committee, foi recomendado a não implementação da norma até que uma substituição para o MARC estivesse em andamento. Reconhecia que a atualização estrutural, da codificação de metadados no catálogo, era tão necessária para a melhoria dos sistemas bibliotecários, quanto a atualização das regras de catalogação.

No momento atual, define-se como a “chave” de navegação na Web Semântica, o linked data. Esse termo foi definido por Tim Berners-Lee, o inventor da Web, em 2006. Ele estabeleceu quatro regras:

  1. Usar Uniform Resource Identifiers (URIs) para nomear as coisas.
  2. Esses URIs devem ser HTTP (Hypertext Transfer Protocol) para que os usuários possam procurá-los.
  3. Usar padrões estabelecidos como RDF ou SPARQL (SPARQL Protocol and Query Language) para fornecer informações úteis quando alguém procurar um URI.
  4. Permitir que os usuários descubram mais coisas, incluindo links para outros URIs.

No mesmo ano de 2006, o relatório “The changing nature of the catalog and its integration with other discovery tools”, da LC, cita o termo e a necessidade de as bibliotecas se adaptarem às expectativas do usuário ao vincular materiais como: trabalhos acadêmicos, páginas Web e outras informações consideradas relevantes. Ter a concepção de que o catálogo não necessita conter tudo, mas a intenção de que o público tivesse um mecanismo de busca ou portal que reunisse todas as informações. A vinculação dessas informações à web, poderia aumentar a visibilidade da biblioteca e atrair os usuários existentes e os potenciais. Além de colaborar para retirar a biblioteca de seus “silos de informação”.

Nestes contextos, considera-se que o BIBFRAME tenha o potencial de abordar muitos dos problemas relativos à disposição da informação na web, a partir de uma perspectiva da biblioteconomia e ciência da informação, incluindo: precisão da pesquisa, controle de autoridade, classificação, portabilidade de dados e desambiguação. Também, ao definir o linked data, o BIBFRAME considera essas regras em seu desenvolvimento. E, o seu modelo é construído em torno dessa definição.

Como as regras para linked data requerem um padrão, escolheu-se o RDF, criado em 1997 pelo W3C; e descrito como regras gramaticais para a linguagem dos dados. Esta gramática consiste na declaração tripla. Cada declaração consiste de: sujeito, predicado e objeto. O sujeito é o recurso, o predicado é uma propriedade do recurso, e o objeto é o valor da propriedade. Um exemplo de declaração tripla RDF, seria:

  • O Alienista foi escrito por Machado de Assis:
  • O Alienista” -> é o sujeito
  • foi escrito por” -> é o predicado (Autor)
  • Machado de Assis” -> é o objeto

De acordo com os princípios dos linked data, a cada componente da tripla é atribuído um URI, preferencialmente em HTTP. O alienista, sendo uma obra, tem sua URI. Machado de Assis, também tem um URI. Da mesma forma, o predicado tem um URI para o termo do relacionamento (Autor). Conforme figura abaixo.

Figura 01: Exemplo RDF com linked data

 

 

Esses conceitos não são novidade para os bibliotecários de catalogação. Inserem um nova maneira de tratar os cabeçalhos autorizados nos registros de autoridade do MARC. Entretanto, nem todo objeto em RDF precisa ter um URI; bem como, nem todo campo em um registro de catálogo necessita ser autorizado. No RDF, os valores e não URI podem ser atribuídos aos objetos, como literais. Elas são usadas para identificar valores como palavras, números ou datas. No BIBFRAME, usa-se as literais para descrever propriedades como o número de páginas ou extensão de um recurso; o ano de publicação ou as notas do item.

Assim, definida uma declaração tripla, os dados precisam ser expressos nos formatos que os computadores entendam. Em RDF, eles são conhecidos como serializações, que é o processo de conversão da estrutura de dados em um formato, passível de ser armazenado para recuperação posterior em outro ambiente computacional. Algumas serializações, comumente usadas para RDF, incluem: Turtle, N-Triples, N-Quads, JSON-LD, Notation3 ou N3 e RDF/XML. Elas podem ser usadas pelo BIBFRAME, sendo que algumas, como Turtle, são compreensíveis por humanos.

Além triplos RDF para entender o linked data, a Web Semântica também precisa de vocabulários e ontologias. Apesar de serem termos frequentemente usados de forma intercambiável, possuem distinções. Uma ontologia é um vocabulário mais complexo. Já, os vocabulários são usados para definir conceitos em um campo de estudo ou domínio. Entretanto, ambos definem classes de objetos e os relacionamentos entre os mesmos. O modelo BIBFRAME utiliza triplos RDF e o vocabulário BIBFRAME com a finalidade de trazer os registros catalográficos para ambiência da Web Semântica.

Embora a LC tenha lançado o modelo BIBFRAME original em 2012, o substituíu em abril de 2016 pelo BIBFRAME 2.0. A primeira versão, consistia de quatro classes principais: Creative Work, Instance, Authority e Annotation. A segunda e atual versão – BIBFRAME 2.0, o número de classes principais foi reduzido para três: Obra (Work), Instância (Instance) e Item. Busca refletir o modelo FRBR e LRM, para combinar os conceitos de Expressão e Manifestação para simplificar as coisas. Podemos entender os conceitos principais, da seguinte forma:

  • Obra: o nível mais alto no modelo. Reflete a essência conceitual do recurso catalogado: autor, idioma e o assunto.  A Obra é uma classe basicamente conceitual
  • Instância: nível mais físico. Reflete informações como: local, editor e data da publicação, e o seu formato. Contempla a Manifestação. O bibliotecário de catalogação ao catalogar um Item, está olhando para a Instância de uma Obra. No MARC, é criado um registro bibliográfico para cada Instância.
  • Item: nível inferior do modelo. Refere-se à cópia física ou eletrônica real da manifestação do recurso. Reflete informações como a sua localização (física ou virtual), por etiqueta de prateleira e/ou código de barras e/ou endereço eletrônico. No MARC, essas informações são registradas no registro do item ou no registro de acervo.

Outros três conceitos importantes do modelo:

  • Agentes:  Pessoas, organizações ou entidades corporativas, etc. associadas a uma Obra ou Instância. Podem ser autores, editores, publicadores, ilustradores, compositores ou outros colaboradores.
  • Assunto: pertence apenas ao nível da Obra. Refere-se ao tema abordado pela Obra (obra “sobre”). Tópicos, lugares, expressões temporais, eventos, obras, instâncias, itens, agentes e etc., podem ser todos Assuntos.
  • Eventos: são as ocorrências cujo registro pode ser o conteúdo de uma Obra.

O BIBFRAME usa classes e propriedades RDF. Embora Obra (Work), Instância (Instance) e Item sejam as três classes principais, no vocabulário do modelo, há outras classes, das quais muitas são subclasses das classes principais. Na FAQ sobre BIBFRAME, é explicado que uma classe identifica o tipo de recurso BIBFRAME, da mesma forma que um campo MARC pode agrupar um único conceito. Já, as propriedades servem para descrever com mais detalhes um recurso BIBFRAME, sendo parecido com os subcampos MARC que identificam de maneira específica, aspectos do conceito. A lista completa de vocabulários do modelo é encontrada em https://id.loc.gov/ontologies/bibframe.html. A figura 02 apresenta um diagrama do modelo BIBFRAME e, na figura 03, exemplifica-se uma obra bibliográfica modelada no diagrama.

 

 

Um outro aspecto da concepção do BIBFRAME, sãos os princípios que norteiam seu desenvolvimento. Entre esses, têm-se o objetivo de mudar da mentalidade do MARC de vincular “palavras”, para uma mentalidade de vincular “coisas”; e o de trazer as informações bibliográficas para fora do “silo da biblioteca”. Entretanto, pesquisas sobre essa última questão, da capacidade do BIBFRAME ser usado fora das bibliotecas, ele ainda falha nesse processo. O mesmo, no âmbito biblioteconômico. Autores do artigo “From MARC to BIBFRAME 2.0: crosswalks”, mapearam o formato MARC para BIBFRAME 2.0; e concluíram que, embora haja melhoria de uma versão para outra do modelo, ainda ocorrem falhas. Ressalte-se que a transição para BIBFRAME exigirá a conversão de milhões de registros MARC já existentes. A LC fornece informações sobre as atualizações do BIBFRAME. Também fornece ferramentas para essa conversão. Há, ainda, uma lista de discussão sobre o modelo.

Diante deste contexto, os bibliotecários de catalogação já perceberam que os usuários atuais manifestam expectativas, distintas das manifestadas em décadas passadas (1960, 1970, 1980, 1990 etc.), quando o MARC começou a se desenvolver, evoluir e dominar os catálogos bibliográficos. Entretanto, o MARC ainda é um padrão dominante, mesmo com a Web revolucionando o ambiente da recuperação de informações. Tanto a definição e uso o linked data, quanto a estimativa da morte do MARC, já têm mais de uma década. É hora de as bibliotecas irem fixando seu projeto de mudança ou um plano B, para essa alternativa.  O BIBFRAME não é o único projeto de “dados vinculados”, mas como é desenvolvido pela LC, agrega um apelo popular para sua adoção. Ressalte-se, que o modelo ainda apresenta falhas, porém isso é tema para outras colunas.

Indicação de leitura:

BIBFRAME (Bibliographic Framework). Librarianship Studies & Information Technology, April 23, 2021. Disponível em: https://bitlybr.com/KCltA1 

Sprochi, A. Where are we headed? Resource Description and Access, bibliographic framework, and the functional requirements for bibliographic records library reference model. International Information & Library Review, vol. 48, no. 2, p. 129-136, 2016.

Steele, T.D. What comes next: understanding BIBFRAME. Library Hi Tech, vol. 37, no. 3, p. 513-524, 2019. https://doi.org/10.1108/LHT-06-2018-0085


   518 Leituras


Saiba Mais





Próximo Ítem

author image
TERMOS PARA GÊNERO E FORMA NA CATALOGAÇÃO DESCRITIVA
Julho/2023

Ítem Anterior

author image
BIBLIOTECÁRIOS E A SEMÂNTICA PARA OBRAS RARAS
Maio/2023



author image
FERNANDO MODESTO

Bibliotecário e Mestre pela PUC-Campinas, Doutor em Comunicações pela ECA/USP e Professor do departamento de Biblioteconomia e Documentação da ECA/USP.