Yandex lança ferramenta gratuita de aprendizagem automática

Algoritmo simples e preciso está disponível para cientistas do mundo todo

Algoritmo simples e preciso está disponível para cientistas do mundo todo

Catboost.yandex
O gigante da internet russo Yandex lançou um serviço de aprendizagem automática de código aberto e sem custo para usuários. Intitulado CatBoost, o algoritmo já foi integrado pela Organização Europeia para a Pesquisa Nuclear para analisar dados do Grande Colisor de Hádrons, o maior acelerador de partículas do mundo.

O Yandex, uma das principais empresas de tecnologia da Rússia, criou um algoritmo avançado de aprendizagem de máquinas, o CatBoost, e o disponibilizou gratuitamente para desenvolvedores de todo o mundo.

“Essa é a primeira tecnologia russa de aprendizagem automática de código aberto”, diz Mikhail Bilenko, diretor de pesquisa e inteligência artificial do Yandex.

O aprendizado de máquina, ou aprendizagem automática, permite tomar decisões por meio da análise de dados e pode ser aplicado em áreas diferentes, inclusive na seleção de músicas e no reconhecimento facial.

Como funciona

O CatBoost não é um ‘gato’ comum – o nome deriva de ‘categorical boosting’ (ou ‘aumento categórico’, porque o algoritmo funciona não só com números, mas também com outras categorias de dados, como áudio, texto, ou imagens).

“O CatBoost baseia-se em uma tecnologia de aprendizado de máquinas que funciona muito bem com dados de diferentes fontes”, explica Anna-Veronika Doroguch, chefe de desenvolvimento de sistemas de aprendizagem automática no Yandex.

Entre funções diversas, o algoritmo pode aprimorar a previsão do tempo, ao permitir analisar uma combinação de dados históricos, seja modelos ou dados meteorológicos. O próprio Yandex utiliza o recurso com essa finalidade para melhorar seus serviços.

Mil e uma aplicações

De acordo com o Yandex, o algoritmo se mostrou eficaz em diferentes setores, incluindo de banco e produção. Em um dos casos, o CatBoost ajudou um cliente a melhorar a qualidade do aço produzido.

“A maioria dos algoritmos de aprendizagem automática funciona só com dados numéricos, como altura, peso ou temperatura”, explica Doroguch.

Outros dados, como tipos de nuvens ou edifícios, tiveram que ser ‘traduzidos’ em números antes que os desenvolvedores pudessem usá-los. Ainda assim, por vezes, a informação se perde no meio do processo, e isso afeta o resultado final.

“Criamos o CatBoost como uma fonte aberta para oferecer aos cientistas do mundo inteiro uma ferramenta simples e precisa”, diz Bilenko. “Essa é a nossa contribuição para o desenvolvimento dessa tecnologia.”

Quer receber as principais notícias sobre a Rússia em seu e-mail?
Clique aqui para assinar nossa newsletter.

Autorizamos a reprodução de todos os nossos textos sob a condição de que se publique juntamente o link ativo para o original do Russia Beyond.