Abreviações, gírias e até diferentes apelidos são compilados em base de dados
ShutterStock/Legion-MediaUm programa de computador que analisa grandes volumes de texto não estruturado, e que poderia ser aplicado na detecção de pedófilos em bate-papos na internet, foi desenvolvido por especialistas da Escola Superior de Economia, em Moscou, e cientistas europeus.
O software, que já existe desde 2011, vem sendo utilizado com sucesso pela polícia de Amsterdã, mas tanto o seu nome como detalhes de sua aplicação continuam sendo mantidos em segredo.
O programa é capaz de analisar o conteúdo de bate-papos com base no uso frequente de linguagem sexualmente explícita. Por meio dele, os agentes da polícia obtêm uma representação visual das relações entre os integrantes do bate-papo, o vocabulário utilizado e possíveis atos sexuais. A conclusão final é produzida, em seguida, por um criminalista.
“O banco de dados organiza conceitos do ponto de vista de um computador - como definições de ‘pedófilo’, ‘crime’, ‘flerte’ ou ‘encontro ao vivo’”, explica Aleksêi Neznanov, pesquisador sênior no Laboratório de Sistemas Inteligentes e Análise Estrutural.
“Foi assim que ajudamos a passar informações para o computador a partir de peritos forenses, que agora podem determinar a natureza dos textos, observando os diagramas. Antes, eles liam e analisavam as conversas quase que inteiramente por si mesmos”, acrescenta.
Atualmente, o programa pode analisar textos em inglês, holandês e alemão. Os pesquisadores ainda não conseguem trabalhar como outros idiomas, como russo ou português, uma vez que os recursos ainda estão em desenvolvimento.
Cultura on-line
O software é capaz de rastrear suspeitos mesmo quando eu ou ela usam diferentes apelidos, pois analisa semelhanças no uso de palavras, identifica a sequência em que os fragmentos de texto foram criados e como se relacionam em determinado período.
Ao criar o programa e seu banco de dados, os desenvolvedores levaram em conta as particularidades da cultura de bate-papo na internet. “Compilamos gírias para se referir a partes do corpo, o uso de números em substituição a palavras, além do padrão de abreviaturas”, diz Neznanov.
Também foi necessário implementar medidas para proteger profissionais legítimos, como, por exemplo, fotógrafos especializados em álbuns infantis. “Nesse caso, tivemos que esclarecer o conceito de ‘pedido de fotos e vídeos’”, conclui.
Gostaria de receber as principais notícias sobre a Rússia no seu e-mail?
Clique aqui para assinar nossa newsletter.
Todos os direitos reservados por Rossiyskaya Gazeta.
Assine
a nossa newsletter!
Receba em seu e-mail as principais notícias da Rússia na newsletter: