ONLINE/OFFLINE


BIG BANG, BIG BROTHER, BIG DATA, E BIG BLIOTECÁRIO

O mundo está mais Big e não é pelo tamanho físico, mas pela quantidade e variedade de dados gerados e acumulados analógico e digitalmente. No século passado, o Big aumento da informação foi taxado de “explosão da informação”. Aliás, o universo também se formou por uma grande explosão - o Big Bang. Termo usado para explicar a teoria cosmológica, na qual o universo que estava muito quente e denso começa a se resfriar e expandir ao estado diluído atual e continua em expansão. Quem sabe o Supremo Big Boss, o nosso Big Brother que tudo sabe e tudo vê, agregou informação demasiada composta de incalculável dados de prótons e elétrons. A informação tornou-se massa instável. Neste caldo havia, até então desconhecido, um aglomerado de bibliotecários do tipo Bóson de Higgs que coletavam os registros documentais do gênesis cosmológico. Mas humor a parte, a massa atual de dados representa um universo em expansão que amplia o próprio conceito de informação e a sua própria massificação.

 

Neste sentido, a imprensa de GUTENBERG é celebrada como a máquina impressora que marca o início desta massificação da informação. Até então as ideias e o seu intercâmbio estavam limitados às conexões pessoais. Como aprendemos nos cursos de biblioteconomia, os livros e a sua produção ou reprodução estavam confinados nos monastérios. Como ilustrado pelo filme “O nome da rosa”, as publicações ficavam sob a guarda de monges que, em nome da Igreja Católica, agiam para proteger e preservar os domínios católicos. Algumas décadas após a inovação de Gutenberg, a imprensa se difunde pela Europa, iniciando a massificação dos livros. Com a Reforma Protestante, no século XVI, ocorre a tradução da Bíblia do latim para o alemão e as pessoas têm um estímulo para se alfabetizarem e, ao lerem a Bíblia, não dependem mais de intermediários na compreensão da palavra de Deus, além de poderem escrever. Assim, após algum tempo o fluxo de informação se tornou torrencial, e séculos depois se transforma em um oceano revolto.

 

Desta forma, a era da informação que nos assola é baseada no constante e crescente fluxo de informações como principal motor do poder e da economia. Por centenas de anos, a produção de informação só aumentou. A partir da década de 1950, com o advento da tecnologia torna-se possível a difusão quase instantânea da informação. Tal aspecto ampliou o número de pessoas envolvidas com a produção e o processamento de dados, além do baixo custo da coleta colaboram no acelerar da velocidade de produção da informação. Desta época cunha-se a expressão explosão da informação. Será o Big Data o eco desta explosão? Uma nova detonação de hidrogênio binário de Petabytes-de-megatons?

 

Big Data é um termo genérico para definir as tendências que abordam o ambiente atual de volume da informação. Se no mundo analógico a produção era crescente, na ambiência da Internet eclode maior aumento de um conjunto dos grandes dados. Mayer-Schonberger e Cukier (2013, p. 4) ao abordarem a definição de Big Data salientam que:

 

É fácil ver os frutos da sociedade da informação com um celular em cada bolso, um computador em cada mochila e grandes sistemas de tecnologia da informação em todos os escritórios. Mas discreta, contudo é a informação em si. Meio século depois de os computadores entrarem no meio social, os dados começaram a se acumular a ponto de algo novo e especial começar a acontecer. O mundo não apenas está mais cheio de informação como também a informação está se acumulando com mais rapidez. A mudança de escala levou a uma mudança de estado. A mudança quantitativa gerou uma mudança qualitativa. Ciências como astronomia e a genômica, que vivenciaram uma explosão nos anos 2000, cunharam o termo ‘big data’.

 

Caracterizam o big data em três Vs:

 

§  Volume: compreende grandes dados que diferem dos dados regulares no tamanho dos conjuntos de dados. Esses dados dependem da aplicação e, geralmente, definidos como dados que não podem ser armazenados ou analisados por softwares convencionais que lidam com dados do tamanho de kilobytes, enquanto ferramentas para big data pode lidar com conjuntos de dados do tamanho de Terabytes e Petabytes.

§  Velocidade: relativo à velocidade de criação dos dados. Pense na rapidez de alguém criar um twitter ou pasta no facebook, ou na rapidez de milhares de sensores medirem de forma constante as mudanças de temperatura do ar, mar etc.

§  Variedade: aspecto que torna o conjunto de grandes dados difícil de organizar e analisar. Tradicionalmente, o tipo de dados coletado sempre foi regiamente controlado e estruturado em uma base ou planilha com linhas e colunas específicas e corrigidas. O conjunto de grandes dados pode conter dados não estruturados como: e-mail, fotografia, mensagens em fóruns, e mesmo transcrições telefônicas.

 

O termo se expande para todos os campos do conhecimento humano, apesar da falta de definição ou conceituação clara. O entendimento se baseia no crescimento volumoso da informação não estruturada, e que requer ser processada em grande escala e não mais em escala menor, para extrair novas informações e estabelecer novos valores que alterem a economia, as organizações, as relações sociais e as formas de governo. Consequência que afetam as bibliotecas e o trabalho bibliotecário. Aliás, o aumento crescente da informação sempre afetou o trabalho bibliotecário. A mais de 70 anos já se manifestava a preocupação da comunidade bibliotecária em quantificar o crescimento do volume de dados em bibliotecas. Em 1944, Arthur Fremont Rider, bibliotecário da Wesleyan University, publicou o livro The Scholar and the Future of the Research Library (New York : Hadham Press), onde estimou que as bibliotecas universitárias norte-americanas dobrariam de tamanho a cada 16 anos. Baseado nesta taxa de crescimento, Rider projetou, por exemplo, que a Biblioteca da universidade de Yale, em 2040, teria cerca de 200 milhões de volumes, ocupando mais de 6.000 quilômetros de prateleiras o que exigiria uma equipe de catalogação composta por mais de seis mil pessoas. É possível projetar em 2040 as grandes bibliotecas universitárias e públicas brasileiras? Nem dá para pensar. Ainda mais com tanto catalogadores juntos.

 

O fato é que para onde olhamos, nos dias atuais, existe informação (boa ou ruim; relevante ou simples lixo). Devido à sua prevalência e impactos potenciais do Big Data, os bibliotecários precisam compreender o seu significado e os possíveis efeitos sobre a recuperação da informação. Profissionais atuantes em serviços de informação corporativos precisam saber como as empresas aproveitam seus grandes volumes de dados, como a mineração destes dados proporciona uma vantagem competitiva, bem como aprender a lidar com tais conjuntos de dados. Da mesma forma, bibliotecários universitários precisam entender qual a diferença do Big Data para outros dados científicos (se existe), e do impacto da utilização de ferramental (software e hardware) para a análise dos mesmos. Afinal, no seu ambiente há criação de repositórios e de ferramentas para gerenciar tudo de forma eficaz. Agora, também deve fazer a curadoria de ativos digitais, um desafio ao mesmo tempo semelhante e diferente do gerenciamento de arquivos documentais.

 

Os bibliotecários em diversas tipologias de bibliotecas, a fim de facilitar o processo de organização, pesquisa e recuperação deverão estar cientes sobre as características e formas de exploração do Big Data, no contexto de sua atividade. A novidade do Big Data não está na definição, mas na forma de leitura a ser feita da informação produzida. O termo Big Data ou conjunto de grandes dados está na moda, para identificar algo que sempre existiu, e que sempre esteve em nosso contexto social, só assimilada apenas em dosagem palatável. Agora ganha mais evidência, com certo deslumbre como se fosse uma pedra filosofal de todo o conhecimento. O problema é que só olhamos para a superfície da informação e pouco para sua camada acumulativa mais profunda.

 

Aspecto importante, neste cenário que clama pelos cientistas da computação, estatísticos, matemáticos, economistas, sociólogos é o bibliotecário assumir um papel proativo na intenção de tornar os conjuntos de dados mais úteis, e acessíveis por meio do desenvolvimento de taxonomias, esquemas de metadados, e métodos sistematizados de recuperação da informação. Temos competência na gestão de informação. Por mais elementar ou limitado que possamos pensar, nossos métodos de organização da informação são também pertinentes no ambiente atual. Apesar da ênfase dada aos dados denominados não estruturados, Big Data é tudo (todo dado) somado para análise em totalidade. A habilidade de organização bibliotecária é fundamental para esta denominada ciência de dados, que se manifesta mais fortemente no componente do problema de curadoria de dados. Arquivistas digitais, curadores de dados e outras tipologias da moda que designam diversos profissionais, incluídos os bibliotecários, também indicam que somos convidados a aconselhar as instituições no armazenamento e acessibilidade dos conjuntos de grandes dados. Ademais, bibliotecários são bons comunicadores e foram treinados na arte e ciência de transformar as necessidades de informação do usuário em estratégias e recursos para a pesquisa e a aprendizagem. Portanto, eles têm clareza sobre a questão do fluxo de informação, agora envolvendo o problema dos grandes volumes de dados. A dúvida é o que acontece no meio desta equação, onde a transformação, análise e visualização dos dados torna-se a essência dos empreendimentos com Big Data? Neste sentido, resta esclarecer como a biblioteconomia pode ser conectada com as demais ciências envolvidas no trato dos dados. Mike Furlough (2012) observa que os bibliotecários sabem o valor das fontes de informação tradicionais, mas qual é o valor dos dados menos estruturados, os chamados "dados brutos”? Podemos desconhecer o valor dos dados brutos, mas a chave para o seu entendimento é por meio das novas e poderosas ferramentas de visualização e análise da informação, que possibilitam olhar para os dados de novas maneiras, além da finalidade para a qual eles foram originalmente produzidos.

 

Exemplo de projeto na área pode ser observado no trabalho do National Library Board (NLB) de Cingapura que utiliza mineração e tecnologias para análise de dados, e para conectar o seu conteúdo estruturado e não estruturado de maneira que a informação relevante possa ser entregue automaticamente aos usuários de seus sites e portais. A NLB é um consórcio de 25 bibliotecas públicas e a Biblioteca Nacional, contando com mais de um milhão de títulos físicos, que geram cerca de 30 milhões de empréstimos por ano. Segundo Kelly Ng (2013), ao adotar técnicas de mineração sobre os dados de operações da circulação e dos registros bibliográficos de livros, a biblioteca conecta com sucesso os seus títulos e desenvolve um serviço de recomendação de obras em seus sites.

 

Um exercício simples para os bibliotecários que queiram tomar contato com aspectos de Big Data pode ser feito no Immersion. A ferramenta desenvolvida pelo MIT Media Labs, é aplicável para quem tem conta no Gmail. Ela vasculha a caixa de entrada e mostra diferentes contextos das correspondências, como: quem são os destinatários preferências de sua correspondência; qual a relação existente entre seus contatos; o tempo de correspondência com cada contato; período das mensagens enviadas; quantidade de e-mails trocados, entre outras informações extraídas. Estas informações são apresentadas em gráfico interativo. Para um esclarecimento sobre os fundamentos da ferramenta e a importância dos metadados, recomenda-se assistir a apresentação: The Power of Metadata.

 

Por fim, neste mundo dos fenômenos tecnológicos e digitais, nem tudo é um bicho de sete cabeças. Aliais, não há bichos, tudo pode ser compreendido, só depende de quantas cabeças o bibliotecário irá contar para compartilhar e interagir na compreensão coletiva, e não solitária. Uma cabeça sozinha só pensa, muitas processam, organizam e compartilham as informações, pois pensam melhor. Ao invés de ser UnoBliotecário (um é pouco) ou BiBliotecário (dois é bom), melhor ser BigBliotecário, afinal o volume de trabalho é grande e vários profissionais colaborando, rende rede rentável.

 

Indicação de leitura:

Mike Furlough. Research Libraries and “Big Data”. ScholarSphere, 2012. Disponível em: https://scholarsphere.psu.edu/downloads/wp988j82g

Kelly Ng. Singapore library uses analytics and big data technology to ease users’ search. FutureGov, 11/09/2013. Disponível em: http://goo.gl/uoaa3C

 

Viktor Mayer-Schönberger; Kenneth Cukier. Big Data: como extrair volume, variedade e valor da avalanche de informação cotidiana. Rio de Janeiro : Elsevier, 2013.


   790 Leituras


Saiba Mais





Próximo Ítem

author image
LINKED DATA: O BIBLIOTECÁRIO A TRICOTAR OS DADOS DE SEUS REGISTROS
Dezembro/2013

Ítem Anterior

author image
FALESEMENGASGARADGMNAAACRESTANASISBDEAGORANARDA
Setembro/2013



author image
FERNANDO MODESTO

Bibliotecário e Mestre pela PUC-Campinas, Doutor em Comunicações pela ECA/USP e Professor do departamento de Biblioteconomia e Documentação da ECA/USP.