A profissão de Cientista de Dados continua crescendo na mesma velocidade em que os dados são gerados pela humanidade. Conceitos como Big Data e Ciência de Dados ganham cada vez mais importância dentro das empresas. Profissionais atentos a esta expansão, buscam entender como aproveitar o conhecimento que já possuem e evoluir nesta carreira que já domina o cenário de contratações na América do Norte e Europa (veja matéria sobre contratações aqui). Em breve o Brasil vai chegar lá.
Mas afinal, que habilidades deve ter o Cientista de Dados? Que conhecimentos o fazem um profissional tão buscado atualmente? Tenho visto algumas discussões sobre o que é um Cientista de Dados. Definições como: “Cientista de Dados é um estatístico que sabe programar” ou “Cientista de Dados é um programador que sabe estatística” não poderiam ser mais equivocadas e demonstram como as habilidades necessárias para se tornar Cientista de Dados ainda não estão claras.
Para ajudar os profissionais, o site Analytics Week tem realizado diversas pesquisas entre os profissionais que já trabalham como Cientista de Dados, com o objetivo de mapear e entender quais são suas habilidades. Eles chegaram a uma conclusão interessante: os Cientistas de Dados não possuem a mesma formação e conjunto de habilidades. Ou seja, os profissionais de dados diferem em relação às competências que possuem. Por exemplo, alguns profissionais são proficientes em habilidades estatísticas e matemáticas, enquanto outros são proficientes em habilidades de ciência da computação. Outros ainda têm uma forte visão de negócios, enquanto outros são mais focados em desenvolvimento de produtos. A análise tentou determinar a amplitude do talento que os profissionais de dados possuem, para entender melhor a possibilidade de encontrar um único Cientista de Dados que seja especializado em todas as áreas (o chamado profissional Unicórnio). A conclusão é clara: O profissional que conseguir reunir todas as habilidades, será definitivamente único no mercado, mas será raríssimo de encontrar (e por isso mesmo, muito bem remunerado). A Ciência de Dados é na verdade um esporte coletivo, em que cada membro da equipe possui habilidades analíticas que se complementam. Veremos cada vez mais, Data Science Teams, sendo formados dentro das empresas, exatamente pela inviabilidade se encontrar um único profissional que reúna todas as habilidades necessárias de Ciência de Dados. Essa conclusão é bem animadora, pois significa que haverá ainda mais espaço para profissionais com habilidades analíticas e conhecimento em Ciência de Dados.
Mas quais são as habilidades necessárias a um Cientista de Dados? A pesquisa inicialmente levou a estas 25 habilidades divididas por área de especialização:
Após realizar a pesquisa com profissionais de Ciência de Dados e busca em perfis no LinkedIn, estas foram as 10 habilidades mais encontradas nos profissionais que trabalham como Cientistas de Dados:
- Comunicação
- Gestão de Dados Estruturados
- Matemática
- Gestão de Projetos
- Data Mining e Visualização
- Design de Experimentos
- Gestão de Dados
- Design e Desenvolvimento de Produtos
- Modelagem estatística
- Desenvolvimento de negócios
A lista das principais habilidades de Ciência de Dados depende do tipo de Cientistas de Dados que se está considerando. Enquanto algumas habilidades de Ciência Dados parecem ser comuns entre os diferentes tipos de profissionais de dados (ou seja, Comunicação, Gerenciamento de dados estruturados, matemática, mineração de dados e ferramentas de visualização, gestão de dados e design e desenvolvimento de produto), outras habilidades são únicas para determinadas funções, sejam elas de Analista de Dados, Cientista de Dados, Engenheiro de Dados, Analista de Marketing, etc… (Clique aqui para acessar o posto sobre carreiras em Data Science).
Um outro artigo também interessante, escrito por DJ Patil, (talvez hoje um dos Cientistas de Dados mais famosos do mundo, nomeado recentemente pelo Presidente dos EUA como U.S. Chief Data Scientist da Casa Branca) e publicado na Harvard Business Review, afirma que as habilidades do Cientista de Dados dependem da função que ele exerce, sejam elas mais técnicas ou mais voltadas para a criação de produtos ou apps de análise de dados. Segundo o artigo, estas seriam as habilidades necessárias para se tornar um Cientista de Dados:
- Conhecimento em linguagens de programação de análise de dados (R, Python e SQL)
- Comunicação
- Visualização de Dados
- Data Mining
- Estatística
- Infraestrutura de Big Data (Hadoop, MapReduce e Spark)
- Machine Learning
- Engenharia de Software
- Álgebra Linear
- Foco em solução de problemas
Há ainda um artigo escrito por Ferris Jumah, Cientista de Dados bastante atuante na comunidade internacional, que listou estas como sendo as habilidades principais de quem trabalha como Cientista de Dados:
Perceba que extraímos as habilidades do Cientistas de Dados de 3 fontes diferentes e que chegamos basicamente ao mesmo resultado. A verdade é que os profissionais que forem capazes de adquirir esses conhecimentos, estarão no radar dos recrutadores e das empresas e farão parte de equipes de Ciência de Dados.
Eu concordo plenamente com todas as habilidades listadas e acrescentaria ainda a habilidade de ser Contador de Histórias (leia aqui o post sobre isso).
O Cientista de Dados deve focar não apenas nas habilidades técnicas, mas também nas suas habilidades pessoais, principalmente Comunicação. O objetivo final de qualquer análise de dados é gerar suporte para a tomada de decisões e isso precisa ser comunicado de forma eficiente ou todo o trabalho de análise não fará muito sentido.
David Matos
Referências:
Investigating Data Scientists, their Skills and Team Makeup
Olá, Alguma indicação de um bom livro sobre mineração de dados (Data Mining) ? Obrigada
Oi Tabata. Dá uma olhada neste link do KD Nuggets: http://www.kdnuggets.com/2015/10/amazon-top-20-books-data-mining.html
Este livro aqui é muito bom: https://www.amazon.com.br/Science-Neg%C3%B3cios-Minera%C3%A7%C3%A3o-Pensamento-Anal%C3%ADtico/dp/8576089726/ref=pd_sim_14_1?_encoding=UTF8&psc=1&refRID=74HHEJYFPV20QYPFMC00
Este outro também: https://www.amazon.com.br/Introdu%C3%A7%C3%A3o-Minera%C3%A7%C3%A3o-Dados-Leandro-Augusto/dp/853528446X/ref=sr_1_1?s=books&ie=UTF8&qid=1504205783&sr=1-1&keywords=minera%C3%A7%C3%A3o+de+dados
Ambos são ótimos. O primeiro é ideal para quem está entrando no mundo do Data Science, mas que ainda está por entender os princípios desta ciência e as suas possibilidades; explica bem os conceitos e abstrai muito da complexidade matemática envolvida nos modelos abordados no texto – eu diria que é um bom livro para começar. O segundo livro já não é tão introdutório e está bem focado na prática, utilizando algoritmos implementados em linguagem R.
Muito legal o artigo.
Parabens!
Valeu Sergio, obrigado!
Faltou uma ESSENCIAL que é SENSEMAKING (que é a capacitadade de gerar clareza e entendimento de dados/situações complexas). Uma combinação de competências: análise, problem solving e empatia.
Esqueci de fazê-lo mencionar isso ?
E sobre cursos, existe alguma recomendação? Interesse muito grande em Ciência de dados comportamentais.
Oi Nilo. Recomendo os cursos da Data Science Academy, sem dúvida os melhores do mercado: https://www.datascienceacademy.com.br/