BIBLIOTECONOMIA DIGITAL


INTELIGÊNCIA ARTIFICIAL EM BIBLIOTECAS

Temos ouvido falar tanto de inteligência artificial (IA) que até já cansou, né? Mas a conversa nem começou ainda..... é claro que existem muitas dúvidas e especulações, mas é fato que não dá para imaginar um futuro sem considerá-la e todas (TODAS) as áreas serão afetadas por ela. Não é uma questão se vai impactar as bibliotecas, mas quando.

A atenção à inteligência artificial ganhou destaque quando o computador IBM Deep Blue venceu uma partida de xadrez ao jogar com o campeão Garry Kasparov em 1997. Outras partidas foram realizadas, com Kasparov mantendo sua hegemonia, porém esta derrota evidenciou a possibilidade de prover uma máquina com informações e ela ser capaz de tomar decisões com base nos dados disponíveis.

Sistemas de inteligência artificial são construídos com largas bases de dados e algoritmos que possuem capacidade de aprender (machine learning). A partir de estrutura e regularidade de dados é possível a estes sistemas adquirirem conhecimentos por meio de repetição de padrões utilizados e fazerem inferências. Muitos sistemas com IA utilizam-se de large language model (LLM), um tipo de algoritmo que usa técnicas de deep learning (aprendizado profundo, em tradução livre) em grandes volumes de dados, onde consegue identificar, sumarizar, gerar e prover novos conteúdos. Esta criação, entretanto, não é gerada de forma espontânea, com a máquina tirando conclusões sozinha ou pensando de forma autônoma. A IA responde questões que são apresentadas e a precisão da resposta depende da clareza da pergunta que foi feita. A eficiência da IA também depende dos dados que a alimentam, de onde obtém os elementos para responder às perguntas que foram feitas.

Vejam por exemplo um teste que fiz com o ChatGPT (1):

Liliana: Quem inventou o avião?

ChatGPT: Os irmãos Wright, Orville e Wilbur Wright, são creditados por terem inventado e construído o primeiro avião do mundo. Eles conseguiram realizar o primeiro voo controlado e sustentado do mundo em 17/12/1903 próximo de Kitty Hawk, na Carolina do Norte.

Liliana: Quem foi Santos Dumont?

ChatGPT: Santos Dumont, nome completo Alberto Santos-Dumont, foi um pioneiro aviador brasileiro. Sua mais conhecida contribuição foi o desenvolvimento da aviação, particularmente seu dirigível e o avião de asa fixa. Também é reconhecido como uma das figuras da história da aviação, juntamente com os irmãos Wright. Ele fez significativos avanços, incluindo o recebimento de um prêmio por voar seu avião 14-Bis em demonstração pública em Paris, em 1906.

Liliana: Quem inventou o avião, os irmãos Wright ou Santos Dumont?

ChatGPT: Os irmãos Wright, Orville e Wilbur Wright são creditados como os inventores e construtores da aviação. Santos Dumont, considerado um pioneiro significante da aviação, é conhecido por suas contribuições, mas não inventou o avião. Os irmãos Wright realizaram o primeiro voo controlado e sustentado do mundo em 17/12/1903 próximo de Kitty Hawk, na Carolina do Norte.

Liliana: Quem é o pai da aviação?

ChatGPT: O título de pai da aviação é usualmente atribuído a diversos pioneiros, mas é comumente associado aos irmãos Wilbur e Orville Wright, os irmãos Wright. A máquina poderosa deles realizou um voo de sucesso em 1903, gerando um marco na história da aviação em decorrência do reconhecimento pelas contribuições no desenvolvimento de aeronaves.

Liliana: Qual foi o primeiro avião com propulsão própria a voar?

ChatGPT: o Flyer dos Irmãos Wright, que voou com sucesso em 17/12/1903 próximo de Kitty Hawk, na Carolina do Norte, é considerado o primeiro avião com propulsão própria. O voo histórico marca o início da aviação.

Liliana: O Flyer utilizou uma catapulta para voar?

ChatGPT: Não, o Wright Flyer não usou uma catapulta em seu voo histórico em 17/12/1903. Os irmãos Wright usaram uma rampa de lançamento com 60 pés que ajudou a aeronave a ganhar velocidade suficiente para levantar voo. O Flyer tinha uma estrutura de madeira e utilizava motor com força de 12 cavalos que foi desenhado e construído pelos irmãos Orville e Wilbur Wright.

Evidentemente existe polêmica na resposta. Realmente os irmãos Wright voaram antes do 14-Bis de Santos Dumont, porém o Flyer foi propulsionado por uma rampa de lançamento (apesar de existirem fontes que afirmem que usaram uma catapulta (2)), enquanto o 14-Bis tinha propulsão própria com motor movido a gasolina, sem ajuda de ventos ou rampas de lançamento (3). Os irmãos Wright são considerados os primeiros que inventaram uma máquina mais pesada que o ar e que voava de forma controlada e o fato de usarem ajuda externa não é destacada nas respostas do ChatGPT.

As bases que alimentam o GPT são essencialmente norte-americanas e isso é o suficiente para o algoritmo afirmar que os irmãos Wright são os inventores do avião e nem ponderar que é uma pergunta polêmica, afinal a comparação não é adequada, visto que os irmãos usaram propulsores para permitir o voo, enquanto o 14-Bis saiu do chão de forma própria, sem uso de catapulta ou rampa de lançamento. Santos Dumont somente aparece nas respostas quando é feita uma pergunta específica pelo nome dele. Se eu não sei nada sobre Santos Dumont, não será pelo ChatGPT que saberia. Se as fontes do ChatGPT fossem europeias, será que as respostas seriam as mesmas? Se as fontes são brasileiras, não tenho dúvida que seria a primeira resposta.

Outro fato de destaque é que a comunicação na primeira década dos anos 1900 não era rápida. Quando os irmãos Wright souberam que tinha outro aviador sendo reconhecido por seu feito na Europa, trataram de levantar documentações que comprovavam o voo realizado em 1903, reiterando a eles os créditos do invento. Ou seja, Dumont foi creditado como o inventor da aviação em 1906 porque não se sabia na Europa que os Irmãos Wright tinham conseguido voar em 1903. Até terem comprovado que o Flyer voou antes, o 14-Bis era reconhecido como a máquina voadora. De qualquer forma, a resposta não é precisa até os dias de hoje, porque depende da fonte que foi consultada e quais critérios são considerados para determinar qual foi o primeiro voo, com ou sem propulsão própria. E este último aspecto nem foi considerado pelo ChatGPT, que inclusive nega o uso de catapulta.

Este episódio mostra que a IA possui informações importantes, mas não pode, em hipótese alguma, ser considerada a única fonte de dados. Tampouco podemos confiar cegamente em suas respostas, porque, da mesma forma que humanos, suas fontes são alimentadas por materiais que contém viés, preconceitos, interpretações dúbias, fatos históricos imprecisos etc. Então, dependendo do ponto de vista de como a fonte foi gerada, a resposta vai variar. Como nos livros!

É uma boa ferramenta e pode ajudar bastante nas atividades, principalmente como ponto de partida para pesquisas quando não sabemos muito sobre um tema. Pode também nos ajudar a interpretar grandes volumes de dados, criando predições que são analisadas com base em dados estatísticos e que podem ser difíceis de identificar por olhos não matemáticos. Pode automatizar ações rotineiras, preparando boa parte de conteúdo, mas que precisará de um ajuste ou conferência posterior. Tem sido utilizada por analistas de sistemas para criação e expansão de códigos, facilitando atividades trabalhosas e que não precisam ser feitas integramente à mão.

As possibilidades de aplicação em bibliotecas são diversas, desde atividades técnicas até a prestação de serviços de informações aos usuários. Podemos listar aqui algumas opções, porém não se trata de uma lista exaustiva:

  • Catalogação: a descrição de recursos bibliográficos pode ser essencialmente feita por máquinas, com o bibliotecário ajustando os dados de acordo com sua política de catalogação e necessidades da comunidade atendida;
  • Qualidade de dados: validação e correção de dados de catalogação/digitação como erros ortográficos, campos, subcampos e indicadores MARC errados ou incompletos;
  • Indexação: levantamento dos termos para descrever conteúdos de recursos bibliográficos;
  • Número de chamada: sugestão de números de classificação (CDD/CDU) e notação de autores (Cutter/PHA), de acordo com os dados do acervo;
  • Resumos: elaboração de resumos a partir de textos completos;
  • Levantamento bibliográfico: elaboração de listas de recursos bibliográficos disponíveis no acervo a partir de critérios de busca (autores, assuntos, período analisado, faixa etária dos usuários etc.);
  • Pesquisas: expansão de pesquisas, construindo perspectivas complementares que proporcionem outras opções de descoberta;
  • Análise de coleção: identificação de recursos bibliográficos presentes no acervo e as relações existentes entre eles;
  • Enriquecimento de dados: possibilidade de incluir dados aos recursos bibliográficos de forma a conectá-los com datasets externos (VIAF, Lattes, ORCID, Wikidata etc.) fazendo a reconciliação;
  • Desbaste: levantamento de recursos bibliográficos que podem ser descartados a partir de dados de uso, circulações, reservas etc.;
  • Preservação: alertas sobre necessidade de atualização de sistemas, suportes ou demais elementos concernentes à preservação de materiais físicos e digitais;
  • Acessibilidade: avaliação dos recursos acessíveis do acervo e possibilidade de expansão aos demais materiais;
  • Inventário: identificação de materiais cadastrados e presentes no acervo;
  • Aquisições: contribuir com previsibilidade na elaboração de listas de aquisições de recursos de informação, apontando melhores condições para compra ou contratação.

Estas são apenas algumas opções de uso da inteligência artificial em bibliotecas, mas não são as únicas. Muitas outras coisas podem ser pensadas e implementadas.

Confesso que já tentei catalogar usando o ChatGPT, mas o resultado foi desastroso. Ao buscar pelo ISBN do meu livro e pedir ao ChatGPT para catalogar a obra no MARC 21, qual a minha surpresa ao ver na tela que eu era a autora de Diário de um mago! Não seria nada ruim ter os direitos autorais de um livro de Paulo Coelho, mas ficou evidente que não é possível (ainda) confiar numa catalogação automática pela inteligência artificial. Uma série de fatores precisam ser levados em consideração para que os dados sejam confiáveis, a começar por uma fonte de dados idônea, aberta e interoperável, com definição do detalhamento a ser feito na catalogação, qual código utilizar (AACR2 ou RDA), qual vocabulário controlado será usado para os assuntos etc. E treinar esta IA para ser um bom catalogador, criando dados de autoridades e bibliográficos com qualidade para minimizar os ajustes necessários.

 

A questão da IA está tão aflorada que este ano o tradicional dicionário Cambridge incluiu uma nova definição ao termo ‘alucinação’ (hallucinate): “quando uma inteligência artificial (sistema de computador que possui algumas das qualidades do cérebro humano, como a capacidade de produzir linguagem de uma forma que parece humana) alucina, ela produz informações falsas”.

Dizemos que a IA alucina quando escreve textos sem sentido ou que, embora factíveis, possuam informações imprecisas ou sem lógica. Por que isso acontece? Porque depende das fontes utilizadas para alimentar o sistema de inteligência artificial. Este é mais um motivo por que não podemos confiar cegamente na IA, mas utilizá-la com sabedoria. E, mais do que tudo, usá-la com ética e responsabilidade. É mais uma ferramenta e como tal deve ser operada em nosso benefício, como meio e nunca como objetivo fim. Também devemos orientar nossos usuários sobre o uso desta tecnologia e trazer a discussão para dentro das bibliotecas. O perigo consiste em não nos deixarmos ‘alucinar’ pela novidade, negá-la ou maldizê-la. Conhecer para usar e orientar seu uso ético e produtivo. Para bibliotecas, bibliotecários e usuários.

 

NOTA

1 - Pesquisa realizada em 28/11/2023, em Urbana, Illinois.

2 - https://concursosnobrasil.com/santos-dumont-ou-irmaos-wright-quem-e-o-verdadeiro-pai-da-aviacao/

3 - Fonte consultada: Deutsche Welle (DW, canal de televisão): empresa de broadcast internacional. (https://www.dw.com


   891 Leituras


Saiba Mais





Sem Próximos Ítens

Ítem Anterior

author image
SCRUM NA BIBLIOTECA
Dezembro/2021



author image
LILIANA GIUSTI SERRA

Postdoctoral Researcher Associate na University of Illinois at Urbana-Champaign (UIUC). Doutorado em Ciência da Informação pela Universidade Estadual Paulista Julio de Mesquisa Filho (UNESP). Mestrado em Ciência da Informação pela Escola de Comunicações e Artes da Universidade de São Paulo (ECA/USP). Profissional da informação dos softwares Sophia Biblioteca, Philos e Sophia Acervo.?