Foi publicada em 29 de Agosto de 2016, pela O’Reilly, a Pesquisa Salarial 2016 – Data Science, uma ampla pesquisa sobre o mercado de trabalho na área de Ciência de Dados. O relatório com a pesquisa completa pode ser acessado aqui. Ano passado fiz uma análise similar com a pesquisa salarial de 2015. Clique aqui para acessá-la. Esta é a quarta edição da pesquisa, que começou em 2013.
A pesquisa coletou informações de Cientistas de Dados, Engenheiros e outros profissionais trabalhando com Data Science e Big Data, a fim de descobrir que ferramentas e skills proporcionam um salário maior, tendências e outras informações relacionadas.
A pesquisa foi realizada com mais de 900 profissionais de Data Science em todo o mundo, representando 45 países e mostrou muitos números e fatos interessantes:
- Python e Spark estão entre as ferramentas que mais contribuem para o aumento no salário de Cientistas de Dados.
- Quanto mais experiência em programação, maior o salário.
- Linguagem SQL, R e Python são as ferramentas mais utilizadas.
- Mulheres ganham menos que homens, mesmo fazendo a mesma coisa.
A mediana do salário diminuiu um pouco em relação ao ano passado (de 91 mil dólares anuais, para 87 mil dólares anuais). Mas isso se deve ao maior número de respondentes de outros países. Se considerado apenas os EUA a mediana de salário é de 106 mil dólares anuais.
A maioria dos profissionais que responderam a pesquisa e trabalham com Data Science e Big Data estão em empresas de consultoria, cerca de 15%. Empresas de software, e-commerce e bancos também empregam quantidade considerável de profissionais especializados em Ciência de Dados.
Cerca de 45% dos que responderam a pesquisa, são Cientistas de Dados:
A análise exploratória de dados é a atividade que mais consome tempo do Cientista de Dados. Isso comprova o que todos que trabalham com Data Science já sabem. A fase de preparação dos dados é uma das mais importantes dentro do processo Analítico.
As linguagens SQL, R e Python continuam sendo as principais ferramentas utilizadas por Cientistas de Dados.
Apache Spark segue como líder entre as plataformas de Big Data mais utilizadas. O Hive (do ecosistema Hadoop) e o MongoDB também aparecem no topo da pesquisa. Trabalhar com Big Data Analytics significa trabalhar com grandes quantidades de dados não estruturados e gerados em tempo real.
Ggplot, Tableau e Matplotlib (Python) parecem entre as ferramentas mais utilizadas para visualização. O bokeh, outra poderosa ferramenta de visualização de dados, começa a aparecer como sendo uma opção que tem tudo para conseguir cada vez mais adeptos.
O scikit-learn (Python) continua soberano entre as ferramentas de Machine Learning.
A pesquisa traz ainda informações sobre os sistemas operacionais usados por Cientistas de Dados, com o Windows no topo da pesquisa. Outro fator chama atenção: a incrível utilização do Microsoft Excel com uma das principais ferramentas dentro do processo de Data Science.
A pesquisa apenas confirma o que se vê no mercado de trabalho. Profissionais de dados, como os Cientistas de Dados, nunca foram tão requisitados como hoje. O mundo precisa destes profissionais para extrair informação útil da massa de dados gerada pela humanidade.
David Matos
Referências:
2016 Data Science Salary Survey
Why your kids will want to be Data Scientists