Cientista de Dados – Parte 1

Cientista de Dados

Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos – e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.

Eles são parte matemáticos, estatísticos, parte cientistas da computação e parte analistas de tendências. E, por transitarem entre o mundo dos negócios e de TI, eles são muito procurados e bem remunerados.

Eles também são um sinal dos tempos modernos. Cientistas de dados não estavam no radar há uma década, mas sua popularidade repentina reflete como as empresas agora pensam sobre Big Data. Essa massa imensa de informações não estruturadas já não pode mais ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar receitas – contanto que haja alguém que escave e desenterre insights empresariais que ninguém havia pensado em procurar. Entra em cena o Cientista de Dados.

De onde eles vieram?

Muitos Cientistas de Dados começaram suas carreiras como estatísticos ou analistas de dados. Mas conforme o Big Data (e as tecnologias de armazenamento e processamento de Big Data, como o Hadoop) começaram a crescer e evoluir, esses papéis também evoluíram. Dados não são mais somente uma reflexão tardia para o departamento de TI cuidar. Eles são informações importantes que exigem análise, curiosidade criativa e um talento especial para traduzir ideias de alta tecnologia em novas maneiras de obter lucro.

O papel do Cientistas de Dados também tem origens acadêmicas. Há alguns anos, as universidades começaram a reconhecer que os empregadores queriam programadores e pessoas que tivessem espírito de equipe. Professores ajustaram suas aulas para acomodar isso – e alguns programas, como o Institute for Advanced Analytics na North Carolina State University, preparam-se para produzir a próxima geração de Cientistas de Dados. Existem hoje mais de 60 programas semelhantes em universidades nos EUA.

Funções típicas dos Cientistas de Dados

Não há uma descrição de trabalho definitiva quando se trata de um Cientista de Dados. Mas aqui estão algumas coisas que você provavelmente terá de fazer:

• Coletar grandes quantidades de dados “unruly” ou desafiadores e transformá-los em um formato mais prático.
• Solucionar problemas de negócios com técnicas de orientação à dados.
• Trabalhar com uma variedade de linguagens de programação, incluindo R e Python.
• Ter uma sólida compreensão de estatísticas, incluindo testes estatísticos e distribuições.
• Manter-se a par das técnicas analíticas, como a aprendizagem de máquinas, ou machine learning, a aprendizagem profunda, ou deep learning e análise de dados textuais, ou text analytics.
• Comunicar-se e colaborar com TI e área de negócios.
• Procurar por ordens e padrões nos dados, bem como detectar tendências que podem ajudar os resultados de uma empresa.

O que um Cientista de Dados tem em sua caixa de ferramentas?

Esses termos e tecnologias são comumente usados por Cientistas de Dados:

• Visualização de dados: a apresentação de dados em um formato pictórico ou gráfico para que eles possam ser facilmente analisados.
• Machine learning: ou aprendizagem de máquinas, é um ramo da inteligência artificial baseado em algoritmos matemáticos e automação, que permitam uma máquina a aprender e/ou aperfeiçoar seu desempenho em alguma tarefa.
• Deep learning: ou aprendizagem profunda, uma área da pesquisa de Machine Learning que usa dados para modelar abstrações complexas.
• Reconhecimento de padrões: a tecnologia que reconhece padrões nos dados (usada muitas vezes como sinônimo de aprendizagem de máquina).
• Preparação de dados: o processo de conversão de dados brutos em um outro formato para que eles possam ser consumidos mais facilmente.
• Text analytics: ou análise de dados textuais, é o processo de examinar dados não estruturados para reunir os principais insights de negócios.

Na segunda parte deste post, veremos como você pode se tornar um Cientista de Dados. Até lá.

David Matos