Cientista de Dados continua sendo a profissão em maior demanda em todo mundo e as empresas estão contratando Cientistas de Dados em três níveis: Júnior, Pleno ou Sênior (também chamado Principal). Esteja você apenas começando em Data Science ou procurando mudar de carreira, inevitavelmente se encontrará em um desses níveis.
Este artigo é resultado de ampla pesquisa e observação do mercado e tem como objetivo esclarecer o que é esperado e o que está fora do escopo de cada nível na carreira em Ciência de Dados. Embora as empresas possam ter diferentes cargos, o artigo fornece uma linha de base geral. Além disso, o post termina com dicas práticas sobre como iniciar sua carreira em Data Science ou conseguir aquela promoção merecida. As referências estão ao final do artigo. Vamos subir de nível.
Matriz de Habilidades em Ciência de Dados
Espera-se que um Cientista de Dados tenha conhecimento em três áreas: Estatística, Programação e Negócios. No entanto, você não deve precisa todas as três áreas desde o início. Quais habilidades você deve focar ao procurar uma posição de nível de entrada? Quais habilidades se tornam mais importantes à medida que avança na carreira? Veremos isso nos itens a seguir.
Cientista de Dados Junior – Entre no Nível 1.0
Cientista de Dados Júnior em geral é graduado, completou alguns cursos online de especialização e está iniciando sua caminhada em Data Science. Áreas de estudo populares incluem Ciência da Computação, Matemática ou Engenharia (embora outras áreas de formação sejam inteiramente possíveis). Um Cientista de Dados Júnior tem 0 a 2 anos de experiência profissional e está familiarizado com a criação de protótipos com conjuntos de dados estruturados em Python ou R. Ele(a) participou de competições no Kaggle e possui um perfil no GitHub.
O Cientista de Dados Júnior pode fornecer um enorme valor para as empresas. Eles geralmente são autodidatas, já que poucas universidades oferecem diplomas em Ciência de Dados e, portanto, mostram tremendo comprometimento e curiosidade, usando cursos online como aprendizado complementar e focado. Eles estão entusiasmados com o campo que escolheram e estão ansiosos para aprender mais. O Cientista de Dados Júnior é bom em prototipagem de soluções, mas ainda não possui proficiência na mentalidade de negócios.
O Cientista de Dados Júnior deve ter uma forte paixão por Machine Learning. Você pode demonstrar sua paixão contribuindo para projetos de código aberto, participando de desafios do Kaggle e criando seu portfólio.
O que eles fazem?
Se uma empresa está contratando um Cientista de Dados Júnior, geralmente já existe uma equipe de Data Science. A empresa está procurando ajuda para facilitar a vida de colegas mais experientes. Isso envolve testar rapidamente novas ideias, depurar e refatorar modelos existentes. O profissional discutirá ideias com a equipe e lançará novas ideias sobre como fazer as coisas melhor. Assume a responsabilidade pelo seu código, buscando continuamente melhorar a qualidade e o impacto do código. O profissional sabe trabalhar em equipe e está buscando constantemente apoiar seus colegas na missão de criar ótimos produtos de dados.
O que eles não fazem?
O Cientista de Dados Júnior não tem experiência em engenharia de soluções complexas de produtos. Portanto, ele(a) trabalha em equipe para colocar em produção modelos de Ciência de Dados. Como o Cientista de Dados Júnior acabou de ingressar na empresa, ele(a) não está imerso nos negócios da empresa. Portanto, não se espera que ele(a) apresente novos produtos para impactar a Equação Fundamental dos Negócios. No entanto, o que sempre é esperado é o desejo de aprender e melhorar suas habilidades.
Todo início de carreira é complicado pois somente a experiência do dia a dia permite consolidar conhecimentos teóricos, mas com muita vontade de aprender, dedicação e pró-atividade para buscar o conhecimento e praticar, os primeiros passos serão mais fáceis.
Cientista de Dados Pleno – Atingindo o Nível 2.0
O Cientista de Dados Pleno já trabalhou como Cientista de Dados Júnior e tem de 2 a 5 anos de experiência relevante, escreve códigos reutilizáveis e constrói pipelines de dados resilientes em ambientes em nuvem.
O Cientista de Dados Pleno deve ser capaz de enquadrar os problemas da Ciência de Dados. Bons candidatos têm ótimas ideias de experiências anteriores em Data Science.
As empresas preferem contratar Cientistas de Dados Plenos porque fornecem um valor tremendo a um salário razoável. Eles são mais experientes do que profissionais de nível Júnior, omitindo, assim, os caros erros do novato. Eles também não são tão caros quanto os Cientistas de Dados Seniores, embora ainda devam entregar modelos em produção. É um nível muito divertido, tendo ultrapassado o nível 1.0 e ainda tendo espaço para crescer para o nível 3.0.
O que eles fazem?
O Cientista de Dados Pleno domina a arte de construção de modelos analíticos e preditivos. Enquanto os Cientistas de Dados Seniores ou gerentes de negócios atribuem tarefas, o Cientista de Dados Pleno orgulha-se de criar produtos bem arquitetados. Ele evita falhas lógicas no modelo, duvida de sistemas com bom desempenho e orgulha-se de preparar os dados corretamente. O Cientista de Dados Pleno orienta os profissionais de nível Júnior e responde a perguntas de negócios para a gerência.
O que eles não fazem?
O Cientista de Dados Pleno não deve liderar equipes inteiras. Não é sua responsabilidade ter ideias para novos produtos, pois eles são gerados por colegas e gerentes mais experientes. Embora o Cientista de Dados Pleno conheça os detalhes dos produtos que eles criaram, não é esperado que eles conheçam a arquitetura geral de todos os produtos controlados por dados. O Cientista de Dados do nível 2.0 é especialista em Estatística e melhor em programação do que um Cientista de Dados do nível 1.0, mas se afasta da parte não divertida dos negócios no nível 3.0.
Um Cientista de Dados Pleno deve saber publicar seu código em produção (com algum apoio dos Engenheiros de Dados).
O Cientista de Dados Pleno é avaliado pelo impacto que seus modelos geram. Ele(a) tem uma boa intuição sobre o funcionamento interno dos modelos estatísticos e como implementá-los e está no processo de entender melhor os negócios da empresa, mas não é esperado que forneça soluções para problemas de negócios ainda.
Cientista de Dados Sênior ou Principal – Nível Final 3.0
O Cientista de Dados Sênior é o membro mais experiente de uma equipe de Ciência de Dados. Tem mais de 5 anos de experiência e é versado em vários tipos de modelos de Ciência de Dados. Conhece as melhores práticas ao colocar modelos para trabalhar. Sabe escrever código computacionalmente eficiente e está sempre atento para encontrar projetos de negócios de alto impacto.
Além de suas impecáveis habilidades de programação e profunda compreensão dos modelos científicos utilizados, ele(a) também entende firmemente os negócios em que sua empresa trabalha. Ele(a) tem um histórico de impactar a linha de base dos negócios com Data Science.
O Cientista de Dados Sênior precisa ter um entendimento muito bom do problema de negócios que está solucionando antes de escrever uma linha de código. Ou seja, eles precisam ter a capacidade de validar ideias antes da implementação. Essa abordagem aumenta o sucesso do projeto de Data Science.
O que eles fazem?
O Cientista de Dados Sênior é responsável pela criação de projetos de Ciência de Dados de alto impacto. Em estreita coordenação com as partes interessadas, é responsável por liderar uma equipe potencialmente multifuncional no fornecimento da melhor solução para um determinado problema. Portanto, suas habilidades de liderança se desenvolveram desde os níveis 1.0 e 2.0. O Cientista de Dados Sênior atua como consultor técnico para Gerentes de Produto de diferentes departamentos. Com sua vasta experiência e habilidades nas principais categorias de Ciência de Dados, e se torna um ativo altamente valorizado para qualquer projeto.
O que eles não fazem?
Enquanto molda a discussão sobre as habilidades desejadas, não é responsabilidade do Cientista de Dados Sênior recrutar novos membros da equipe. Embora ele(a) entenda os negócios de sua empresa e sugira novos produtos impactantes, os gerentes de produto ainda são responsáveis pela adoção no mercado. Ele(a) também lidera equipes, mas as decisões de progressão na carreira ainda são tomadas pelo líder da equipe.
O Cientista de Dados Sênior deve dirigir os projetos de acordo com as orientações do Chief Data Officer (CDO). Espera-se que essa pessoa obtenha as primeiras habilidades de liderança e, portanto, é importante que se comunique claramente, seja empático e tenha um bom olho para as pessoas.
O Cientista de Dados Sênior analisa porque os produtos de dados falham e, portanto, conduz novos projetos com sucesso. O profissional é um colaborador valioso das discussões sobre produtos e gosta de educar a empresa sobre Data Science. Com sua experiência no fornecimento de soluções impactantes de Data Science, é o ativo mais valioso do departamento de Ciência de Dados.
Conclusão
Navegar nos níveis de carreira em ciência de dados é divertido. Lembre-se dos seguintes tópicos principais:
- Cientistas de Dados Júniores têm boas habilidades estatísticas e matemáticas.
- Cientistas de Dados Plenos se destacam em colocar modelos em produção e dominam programação.
- Cientistas de Dados Seniores sabem como criar valor comercial para suas soluções baseadas em dados.
Para subir de nível, o primeiro passo é avaliar suas habilidades atuais. Na sequência, buscar capacitação profissional através de cursos ou livros e praticar o máximo possível, participando de competições e/ou construindo um portfólio.
David Matos
Referências:
Cientista de Dados – Por Onde Começar em 8 Passos
Becoming a Level 3.0 Data Scientist
Fantastic Data Scientists: where to find them and how to become one
The Difference Between Junior, Mid-Level, And Senior Data Scientist Jobs
um êrru logo na segunda palavra…
Obrigado Carlos. Milhares de pessoas já leram o artigo, mas ninguém tinha alertado sobre o erro. Fiz a correção de Cientista se Dados para Cientista de Dados. Abs. David
Muito bom o artigo, estou começando o meu preparo para ingressar na carreira, iniciei um curso pela Data Science Academy, e espero que eu consiga atingir o meu objetivo.
Então, ao ler seu texto eu entendo o seguinte:
Nível 1: Saber programar (nada de estatística e negócios).
Nível 2: Programar mais e usar bem a estatística. (Nada de pensar em responder problemas de negócio ainda, e sim, executar o que a chefia manda, idem ao nível 1).
Nível 3: Programar MUITO e pensar estrategicamente em soluções, usando estatística e conhecimento do negócio.
Mas aí eu me pergunto? E para o pessoal recém formado em estatística por exemplo, estes já poderiam entrar no mercado como DS plenos? Se o estatístico souber bem sobre manipulação e obtenção de dados dos DBs, esse profissional já está qualificado para ocupar esta posição de ínicio?
Olá Heitor. Na minha opinião sim, perfeitamente!
Amei! Começando agora os estudos e completamente inspirada pelo conteúdo!
Obrigado Giovana.
Parabéns pelo tópico, David!
O Carlos Completo deve ser uma pessoa bastante observadora….não confiem em pessoas muito observadoras, elas são capazes de tudo! hehehe
Obrigado Gerson.
Excelente artigo. Parabéns pelo conteúdo!!!