GERAL


GOOGLE DIZ QUE MUNDO TEM 129.864.880 DE LIVROS

  • Autor não informado
  • Setembro/2010
O mundo tem hoje cerca de 129 milhões de livros. Quem se deu ao trabalho de fazer
essa conta foi o Google, tendo como base seu ambicioso projeto de digitalização de
livros, o Google Books. O número impressiona quando se pensa na Biblioteca de
Alexandria, a maior da antiguidade. Segundo a previsão mais otimista, feita pelo
físico Carl Sagan na série Cosmos, ela teria perto de um milhão de pergaminhos,
possivelmente muitos deles duplicados.
 
O engenheiro de software Leonid Taycher explicou no blog do Google Books o 
complexo processo utilizado pela empresa para fazer o cálculo. O Google coleta
informações de várias fontes como bibliotecas, livrarias e outros catálogos. Com um
arquivo bruto que já ultrapassa um bilhão de registros, a empresa então analisa
esses dados para diminuir a quantidade de duplicações em cada uma das fontes,
baixando o número a 600 milhões.
 
A partir daí é preciso um ajuste fino para diminuir as duplicações que permanecem 
entre as diferentes fontes. Como exemplo, Taycher conta que existem 96 registros
diferentes em 46 fontes do livro "Programando em Perl, 3ª edição". Duas vezes por
semana a equipe unifica todos esses registros em volumes separados, levando em
conta todos os atributos de cada um deles, como nome do livro, autor, editora, ISBN,
ano de publicação, etc.
 
Após todo esse trabalho o algoritmo do Google entregou cerca de 210 milhões de 
volumes, mas esse número muda sempre que a conta é refeita, por causa dos novos
dados que chegam e das mudanças para aperfeiçoar o algoritmo.
 
O número final foi alcançado após a exclusão de microfilmes, gravações de áudio, 
mapas e outras obras que não deveriam ser classificadas como livros: 129.864.880.
 
Em um de seus projetos mais polêmicos, o Google quer digitalizar todos os livros do
mundo, o que tem lhe valido uma grande briga com editoras e autores. O Google
Books já foi criticado até mesmo pelo Departamento de Justiça dos EUA, que acusa
a empresa de não dar a devida proteção ao direitos dos autores das obras.
Fonte: Clique Aqui
Divulgado por Aline - Enviado para "bibliotecarios" em 08/08/2010

   10 Leituras


author image
OSWALDO FRANCISCO DE ALMEIDA JÚNIOR

Professor associado do Departamento de Ciência da Informação da Universidade Estadual de Londrina. Professor do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília. Doutor e Mestre em Ciência da Comunicação pela ECA/USP. Professor colaborador do Programa de Pós-Graduação da UFCA- Cariri - Mantenedor do Site.