Cientistas desenvolvem software para identificar pedófilos na internet

Abreviações, gírias e até diferentes apelidos são compilados em base de dados

Abreviações, gírias e até diferentes apelidos são compilados em base de dados

ShutterStock/Legion-Media
Ferramenta produz diagramas com base em padrões de uso de linguagem em bate-papos.

Um programa de computador que analisa grandes volumes de texto não estruturado, e que poderia ser aplicado na detecção de pedófilos em bate-papos na internet, foi desenvolvido por especialistas da Escola Superior de Economia, em Moscou, e cientistas europeus.

O software, que já existe desde 2011, vem sendo utilizado com sucesso pela polícia de Amsterdã, mas tanto o seu nome como detalhes de sua aplicação continuam sendo mantidos em segredo.

O programa é capaz de analisar o conteúdo de bate-papos com base no uso frequente de linguagem sexualmente explícita. Por meio dele, os agentes da polícia obtêm uma representação visual das relações entre os integrantes do bate-papo, o vocabulário utilizado e possíveis atos sexuais. A conclusão final é produzida, em seguida, por um criminalista.

“O banco de dados organiza conceitos do ponto de vista de um computador - como definições de ‘pedófilo’, ‘crime’, ‘flerte’ ou ‘encontro ao vivo’”, explica Aleksêi Neznanov, pesquisador sênior no Laboratório de Sistemas Inteligentes e Análise Estrutural. 

“Foi assim que ajudamos a passar informações para o computador a partir de peritos forenses, que agora podem determinar a natureza dos textos, observando os diagramas. Antes, eles liam e analisavam as conversas quase que inteiramente por si mesmos”, acrescenta.

Atualmente, o programa pode analisar textos em inglês, holandês e alemão. Os pesquisadores ainda não conseguem trabalhar como outros idiomas, como russo ou português, uma vez que os recursos ainda estão em desenvolvimento.

Cultura on-line

O software é capaz de rastrear suspeitos mesmo quando eu ou ela usam diferentes apelidos, pois analisa semelhanças no uso de palavras, identifica a sequência em que os fragmentos de texto foram criados e como se relacionam em determinado período.

Ao criar o programa e seu banco de dados, os desenvolvedores levaram em conta as particularidades da cultura de bate-papo na internet. “Compilamos gírias para se referir a partes do corpo, o uso de números em substituição a palavras, além do padrão de abreviaturas”, diz Neznanov.

Também foi necessário implementar medidas para proteger profissionais legítimos, como, por exemplo, fotógrafos especializados em álbuns infantis. “Nesse caso, tivemos que esclarecer o conceito de ‘pedido de fotos e vídeos’”, conclui.

Gostaria de receber as principais notícias sobre a Rússia no seu e-mail? 
Clique aqui para assinar nossa newsletter.

Todos os direitos reservados por Rossiyskaya Gazeta.