UNIDADE DIGITAL

Inteligência Artificial para Negócios - Cientistas de Dados, quem são, onde vivem, o que comem e como se reproduzem - por Fabiano Castello

Artigo

12 Julho, 2020

Se este artigo fosse um programa do Globo Repórter, a chamada do programa seria como acima, porque o objetivo deste artigo é comentar sobre este novo profissional tão demandando atualmente mas que, na prática, é muito difícil de ser encontrado. Como, então, as organizações podem suprir suas necessidades para trabalhar com dados digitais? 

O primeiro aspecto importante é definir o que é um cientista de dados. 

Não por acaso este é um assunto que muito me interessa, porque está relacionado não apenas com o meu trabalho, mas, também, com a minha dissertação de mestrado acadêmico na FEA/USP.

Definir o que é um cientista de dados é importante por, principalmente, dois motivos. 

Primeiro, sob a perspectiva de carreiras. Existem muitos jovens que estão ingressando no mercado de trabalho e, claro, sabem que existe esta nova profissão que tem demanda e, reza a lenda, paga muito bem. Ao mesmo tempo, também existem muito profissionais já experientes que pensam em mudar de carreira e poderiam considerar a profissão de cientista de dados. Procurar definir um cientista de dados, quais as principais áreas de formação, quais as principais habilidades e ferramentas que utilizam são informações importantes para quem está pensando em adotar uma nova carreira.

Segundo, sob a perspectiva das empresas que precisam de cientistas de dados. Como formatar uma boa vaga de emprego, que seja mais precisa e contribua para atrair os melhores profissionais? Fazer isto bem feito está diretamente relacionado com ter mais produtividade e atrair profissionais que terão mais longevidade na empresa, reduzindo o turnover.

Mas vamos lá, falar sobre a definição. Um bom trabalho científico começa com uma revisão da literatura, baseada em artigos acadêmicos, ou seja, publicações científicas, que seguem método científico, que são revisadas antes de sua publicação por periódicos acadêmicos relevantes.

Um dos meus eixos de pesquisa é, justamente, a definição de cientistas de dados. Como o mundo acadêmico define o que é um cientista de dados? A partir da análise de mais de 2 mil artigos, identifiquei 54 que estão diretamente relacionados com o tema da minha pesquisa, sendo a maioria artigos publicados de 2015 até 2019. A partir desses artigos encontrei 29 definições de cientistas de dados na literatura e fiz uma análise qualitativa que procurasse sugerir a consolidação de todas as definições:

"Cientista de dados é um profissional geralmente formado em ciência da computação, mas que possui orientação para negócios. Trabalha com dados digitais, tanto estruturados como não estruturados, utilizando abordagem analítica, mas não necessariamente utilizando métodos científicos."

Existem algumas frases que são chave para entender a definição.

Primeiro, "geralmente formado em ciência da computação". Este "geralmente" não é lá muito acadêmico, mas ele está lá porque ciência da computação é, de fato, a principal formação de cientistas de dados. Outras formações, que também tem caráter técnico-quantitativas, como por exemplo matemática, estatística, engenharia e física, aparecem com frequência. 

Segundo, "possui orientação para negócios". Muitas das definições pesquisadas falam sobre "domain knowledge", ou seja, entender do contexto de um trabalho com dados. Por experiência prática, conhecer o negócio, ou entender do contexto, é para mim o primeiro passo para um projeto de sucesso. Sem contexto não dá para saber quais são os dados que fazem ou não sentido. Notem que aqui já é possível concluir sobre um aspecto bastante desafiador para cientistas de dados: apesar de uma formação eminentemente técnica, é fundamental ter visão de negócios.

Terceiro, "trabalha com dados digitais, tanto estruturados como não estruturados". Isto entrou na definição porque o termo "big data" aparece com frequência na maioria das definições estudadas. "Big data" num primeiro momento fala sobre volume, mas o que realmente diferencia quem trabalha com dados nos últimos anos é a habilidade de conseguir trabalhar com dados não estruturados, ou seja, textos, posts de mídia social, arquivos de áudio, imagens e vídeos.

Quarto, "utilizando abordagem analítica, não necessariamente utilizando métodos científicos". A abordagem é sempre analítica, ou seja, quebrar o todo em partes para resolver um problema. Mas, se falamos de "cientista", isto nos leva ao entendimento de que um cientista de dados faz ciência, ou, ainda, segue princípios da ciência: trabalhar embasado em teorias, formular hipóteses, desenhar e conduzir experimentos controlados. Nenhuma das 29 definições estudadas fala sobre seguir este método científico e, por experiência, ainda que controle e cuidado sejam absolutamente necessários, o formalismo científico é algo que raramente está presente.

Talvez um leitor mais atento sinta falta do famoso Diagrama de Venn sobre cientistas de dados, criado por Drew Conway[1], que, de forma sintética, propõe que um cientista de dados é um profissional que tem habilidades de computação, conhece métodos quantitativos e entende de negócios, conforme a figura abaixo:

Em tempo, esta é uma definição que não apareceu no meu trabalho justamente porque não é "acadêmica": é uma opinião de um profissional da área, publicada em um blog na internet. Deve aparecer mais para frente, na condução da pesquisa em si, que vai considerar entrevistas com especialistas da academia e do mercado.

De qualquer forma, é realmente muito difícil achar profissionais que seguem a definição sugerida ou que possuem estas três perspectivas de conhecimento propostas por Conway, e é por isso que o mercado tem chamado esses profissionais de "unicórnios". Um dos trabalhos que consta da minha pesquisa, Baškarada e Koronios [2], de 2017, onde os autores buscam pelo que eles chamam de "criaturas míticas indescritíveis" (SIC). Na conclusão eles informam que não encontraram tais criaturas.

O fato de esses profissionais serem raros nos leva a um segundo aspecto importante sobre cientistas de dados: como se beneficiar de Big Data se o acesso a estes profissionais é difícil?

O segredo, e aí é importante deixar claro que é uma opinião pessoal, é montar um time que tenha diversas habilidades e que, no conjunto, faça o papel de cientistas de dados.

Falarei mais sobre isso num futuro próximo, quando comentar sobre habilidades de cientistas de dados. Neste meio tempo, comente o artigo e dê sua opinião. O que é um cientista de dados para você? 

Abraços e #FiqueEmCasa! Até mais!


Referências

[1] http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram

[2] Baškarada, S., & Koronios, A. (2017). Unicorn data scientist: the rarest of breeds. Program.

* * *
O blog "Inteligência Artificial para Negócios" da Inova Business School é uma iniciativa de levar assuntos técnicos relacionados à novas tecnologias para a maioria das pessoas. Os assuntos em geral estão relacionados a big data, inteligência artificial, transformação digital, ciência de dados e DataViz. Você encontra mais informações, bem como o histórico de todas os posts, em www.fabianocastello.com.br. Para entrar em contato use o email [email protected] ou acesse o qr-code abaixo.