Brasil

Aprendizado de Máquina e Inteligência Artificial levam a investigação jornalística para o futuro

03/09/2021
Aprendizado de Máquina e Inteligência Artificial levam a investigação jornalística para o futuro
arquivo

Plataforma programada para mergulhar em grandes quantidades de arquivos atrás das respostas mais relevantes, lê manuscritos, transcreve áudios e organiza informações no resultado da busca em curto espaço de tempo.

Pesquisar centenas de milhares de documentos de interesse público em instantes, com uma tecnologia de busca super inteligente, capaz de ler manuscritos e transcrever arquivos de áudios, enquanto faz uma varredura dinâmica e procura pelas informações mais relevantes em tempo recorde. Essa é a proposta do Google Pinpoint , ferramenta on-line que tem acelerado investigações jornalísticas e a exploração de grandes quantidades de dados desorganizados.

O sistema faz parte do Journalist Studio , suíte de aplicações da Google News Initiative (GNI) projetadas para colaborar com o desenvolvimento de um ecossistema de notícias ainda mais qualificado. A ideia é, principalmente, otimizar a rotina nas redações e o tempo dos profissionais de imprensa, reduzindo o período utilizado na consulta a grandes volumes de conteúdos e, consequentemente, aumentando o espaço para encontrar boas histórias e construir as melhores narrativas.

No Brasil, a Associação Brasileira de Jornalismo Investigativo (Abraji) deu o pontapé inicial e anunciou, recentemente, que irá publicar duas grandes coletâneas de documentos de interesse público, mensalmente, para exame dos usuários por meio da plataforma.

A decisão é fruto da parceria formalizada recentemente com a GNI, divulgada durante painel exclusivo na 16ª edição do Congresso da Abraji , que contou com a participação de Marco Túlio Pires, diretor do Google News Lab no Brasil , e Reinaldo Chaves, coordenador de projetos na Associação, na semana passada.

“Queremos ao mesmo tempo facilitar o acesso a essas informações e também permitir que as pessoas possam usar todas as grandes funcionalidades do Pinpoint, como pesquisar rapidamente e facilmente em milhares de documentos por entidades como pessoas, empresas/organizações e localizações. Sem dúvida isso poderá ajudar muitos jornalistas brasileiros”, explicou Reinaldo Chaves.

O Pinpoint já oferece bases de dados disponibilizadas por redações americanas, como o The Washington Post e Big Local News, mas qualquer jornalista com acesso à ferramenta pode construir suas próprias coleções, fazendo o upload de documentos e arquivos. Eventos, fatos, nomes de indivíduos, instituições e ambientes/regiões registrados nesses papéis digitais são identificados, assimilados e estruturados automaticamente pela plataforma.

Aprendizado de Máquina

O Pinpoint utiliza o aprendizado de máquina para imprimir as respostas mais interessantes para determinada ação de busca, após percorrer enormes quantidades de materiais, em diversos formatos. A tecnologia faz a triagem automática após sincronização dos conteúdos e inicia a marcação dinâmica de referências para buscas rápidas, até mesmo a partir da transcrição de gravações e identificação de letras escritas à mão.

No lugar do famoso comando “Ctrl + F”, atalho para a caixa de pesquisas em documentos, os profissionais terão ajuda para uma utilização melhorada dos mecanismos da pesquisa do Google e do Mapa de Informações , com o reconhecimento óptico de caracteres e as tecnologias de fala para texto, para escanear PDFs digitalizados, imagens, e-mails, arquivos de áudio e até manuscritos arquivados no Google Drive. A ideia é tornar o processo de investigação de dados mais fácil e com menos risco de consumo de informações falsas.

“O diferencial do Pinpoint é que ele usa o mesmo motor de inteligência artificial da busca do Google para identificar automaticamente as pessoas, os locais e até as empresas mencionadas nos documentos e nos áudios. Ou seja, você vai poder cruzar e encontrar numa fração de segundo todas essas informações, em centenas ou milhares de arquivos ao mesmo tempo. Muitas redações já estão usando o Pinpoint ao redor do mundo, e o Boston Globe recentemente ganhou um Pulitzer com uma matéria que usou o Pinpoint durante a investigação”, acrescentou Marco Túlio, ao longo da oficina.

A análise dos materiais também pode ser feita em outras línguas, como o inglês, o espanhol, o francês, o italiano e o polonês. A tecnologia funciona para os uploads feitos pelos próprios usuários em suas pastas na nuvem.

Jornalismo investigativo

O Pinpoint já se provou útil para projetos de investigação, como o relatório do USA TODAY sobre 40.600 mortes relacionadas ao COVID-19 em lares de idosos, o Reveal’s Look sobre o “desastre de teste” do COVID-19 nos centros de detenção da Imigração e Alfândega dos EUA (ICE), bem como um artigo do Washington Post sobre a crise de opióides.

A velocidade do Pinpoint também ajudou os repórteres em projetos de curto prazo, como o exame do Rappler, com base nas Filipinas, dos relatórios da CIA da década de 1970 e situações de notícias de última hora, como a verificação rápida dos fatos do Verificado MX, com base no México, das atualizações diárias da pandemia do governo.