Business Intelligence e Data Science tem muita coisa em comum e Cientistas de Dados focados em negócios e Analistas de Negócios que trabalham com Business Intelligence são como primos. Ambos usam dados para trabalhar para o mesmo objetivo, mas a sua abordagem, tecnologia e função diferem de diversas maneiras. Vamos definir, comparar e diferenciar Business Intelligence de Data Science.
Business Intelligence
O objetivo do Business Intelligence (BI) é converter dados brutos em insights de negócio que os líderes empresariais e gestores possam usar para tomar decisões. Os analistas de negócios usam ferramentas de BI para criar produtos de apoio à tomada de decisão e gestão. Se você quer construir dashboards de suporte à decisão, visualizações ou relatórios a partir de conjuntos médios de dados estruturados de negócio, então você pode usar ferramentas de BI e métodos para isso. Business Intelligence é composto basicamente de:
Dados internos – dados coletados dentro da organização, gerados por colaboradores, gestores, sistemas e stakeholders em geral.
Tecnologias e ferramentas – OLAP (online analytical process), ETL (extract, transforming and loading), Data Warehousing, business applications.
Tipos de dados usados em Business Intelligence
Insights que são gerados em Business Intelligence são derivados de conjuntos de tamanho padrão de dados de negócio estruturados. Soluções de BI são principalmente construídas à parte de dados transacionais – dados que são gerados durante o curso de um evento de transação, como dados gerados durante uma venda, ou durante uma transferência de dinheiro entre contas bancárias, por exemplo. Dado transacional é um subproduto natural de atividades empresariais que ocorrem em toda a organização, e todos os tipos de inferências podem ser derivadas dela. Você pode usar o BI para obter os seguintes tipos de informação:
Customer service data – respondendo à questão: “ Que áreas de negócio estão causando maior tempo de espera de nossos usuários? ”
Sales and marketing data – respondendo à questão: “ Que estratégias de marketing são mais efetivas e porque? “
Operational data – respondendo à questão: “ Qual o nível de eficiência da operação de help-desk? ”
Employee performance data – respondendo à questão: “ Que colaboradores são mais produtivos? ”
Tecnologias e skills usados em Business Intelligence
Para agilizar o trabalho da área de BI, as empresas precisam se certificar que os dados estejam organizados para facilidade de acesso e apresentação. Pode-se usar bancos de dados multidimensionais para isso. Ao contrário de bancos de dados relacionais, bancos de dados multidimensionais organizam os dados em cubos que são armazenados como matrizes multi-dimensionais. Para que as equipes de BI possam ser capazes de trabalhar com os dados o mais rápido e fácil possível, pode-se usar bancos de dados multidimensionais para armazenar dados em um cubo, em vez de armazenar os dados em vários bancos de dados relacionais que podem ou não ser compatíveis uns com os outros.
Esta estrutura de dados em cubo, permite a utilização de Online Analytical Processing (OLAP) – uma tecnologia através da qual você pode rapidamente e facilmente acessar e usar seus dados para todos os tipos de diferentes operações e análises. Para ilustrar o conceito de OLAP, imagine que você tem um cubo de dados de vendas que tem três dimensões – tempo, região e unidade de negócio. Você pode dividir os dados para ver apenas um quadrado – para ver uma região de vendas, por exemplo. Você pode cortar os dados para ver um cubo menor composto de um subconjunto de tempo, uma região e uma unidade de negócio. Você pode pesquisar para baixo ou para cima para ver os dados, de forma altamente detalhada ou muito resumida, respectivamente. E você pode totalizar, os números ao longo de uma dimensão – para números totais em unidades de negócio, por exemplo, ou para ver as vendas através do tempo e região apenas.
OLAP é apenas um tipo de sistema de armazenamento de dados – um repositório centralizado de dados que você pode usar para armazenar e acessar seus dados. Um sistema de armazenamento de dados mais tradicional comumente empregado em soluções de BI é uma Data Mart – um sistema de armazenamento de dados que você pode usar para armazenar uma área de foco particular de dados, pertencente a uma única linha de negócios na empresa. ETL (extrair, transformar e carregar) é o processo usado para extrair dados, transformá-lo e carregá-lo em seu banco de dados ou Data Warehouse. Os analistas de negócios geralmente têm habilidades e treinamento em negócios e tecnologia da informação. Como uma disciplina, BI depende de tecnologias tradicionais de TI e habilidades específicas.
Data Science
Dentro da empresa, a ciência de dados tem a mesma finalidade que o Business Intelligence – converter dados brutos em insights de negócios que os líderes empresariais e gestores podem usar para tomar decisões baseadas em dados. Se você tem grandes conjuntos de fontes de dados estruturados e não estruturados que podem ou não estar completos e você deseja converter essas fontes em informações valiosas para apoio à decisão em toda a empresa, recorra a um cientista de dados. Ciência de dados centrada em negócio é multidisciplinar e integra os seguintes elementos:
Quantitative analysis – modelagem matemática, análise estatística, previsões e simulações.
Programming skills – habilidades em programação para analisar dados brutos e torná-los acessíveis aos usuários de negócio.
Business knowledge – conhecimento do ambiente de negócio, para melhor compreender a relevância dos resultados encontrados.
Ciência de Dados é uma disciplina pioneira. Cientistas de dados muitas vezes empregam o método científico para a exploração de dados, formação de hipóteses e testes de hipóteses (através de simulação e modelagem estatística). Cientistas de dados com foco de negócios geram conhecimentos valiosos, muitas vezes, explorando padrões e anomalias em dados de negócios. Ciência dados em um contexto de negócios é comumente composta de:
Conjuntos de dados internos e externos – Ciência de dados é flexível. Você pode criar dados corporativos mashups a partir de fontes internas e externas de dados estruturados e não estruturados com bastante facilidade (dados mashup é uma combinação de duas ou mais fontes de dados, que são analisadas em conjunto, a fim de fornecer aos usuários uma visão mais completa da situação em foco).
Tecnologias e ferramentas – Exemplos aqui poderiam envolver o uso de plataformas baseadas em nuvem, programação matemática, estatística e de aprendizado de máquina, de análise de dados utilizando Python e R e de visualização de dados avançados.
Como analistas de negócios, cientistas de dados centrados no negócio produzem produtos de apoio à decisão para os gerentes de negócios e líderes organizacionais. Estes produtos incluem analytics dashboards e visualizações de dados, relatórios não tabulares e tabelas.
Tipos de dados usados em Data Science
Você pode usar a ciência de dados para obter insights de negócios a partir de conjuntos de tamanho padrão de dados de negócios estruturados (assim como BI) ou a partir de conjuntos estruturados, semi-estruturados, não estruturados e Big Data. Soluções de ciências dados não se limitam aos dados transacionais; você pode usar a ciência para criar valiosos insights de todas as fontes de dados disponíveis. Essas fontes de dados incluem:
Transactional business data – Uma fonte de dados de negócio transacional é o mesmo tipo de dados estruturados utilizados em BI tradicional e inclui dados de gerenciamento, atendimento ao cliente, vendas e dados de marketing, dados operacionais e dados de desempenho do empregado.
Social and related to the brand or business – dados não estruturados gerados a partir de e-mails, instant messaging (Skype) e redes sociais Twitter, Facebook, LinkedIn, Pinterest e Instagram.
Machine data from business operations – dados não estruturados gerados automaticamente por máquinas, tal como dados de sensores de automóveis, por exemplo.
Audio, video, image e pdf file data – fontes de dados comuns e bem estabelecidas.
Tecnologias e skills usados em Data Science
Uma vez que os produtos da ciência de dados muitas vezes são gerados a partir de Big Data, soluções de plataforma de dados baseado em nuvem são comuns neste campo. Os dados que são usados na ciência dados são frequentemente derivados de soluções como Hadoop, MapReduce e processamento paralelo. Cientistas de dados devem possuir visão de inovadora e devem pensar fora da caixa, a fim de exigir soluções para os problemas que resolvem. Muitos cientistas de dados tendem para soluções de código aberto quando disponíveis. A partir de uma perspectiva de custo, esta abordagem beneficia as organizações que empregam esses cientistas.
Cientistas de dados com foco em negócios podem usar técnicas de aprendizado de máquina (Machine Learning) para encontrar padrões e obter insights de grandes conjuntos de dados que estão relacionados com uma linha de negócio específica ou o negócio em geral. Eles são qualificados em matemática, estatística e programação, e eles às vezes usam essas habilidades para gerar modelos preditivos. Eles geralmente sabem como programar em Python ou R. A maioria deles sabe como usar SQL para consultar dados relevantes.
Resumindo
As semelhanças entre BI e Ciência de Dados focada nos negócios são bastante claras. O objetivo de ambos, BI e Ciência centrada em dados para os negócios, é converter dados brutos em insights que os gerentes e líderes podem usar para apoio na tomada de decisão de negócios.
Business Intelligence x Data Science diferem no que diz respeito a utilização dos dados. Apesar de BI poder utilizar métodos para previsão de futuro, esses métodos são gerados para fazer inferências simples a partir de dados históricos ou atuais. Desta forma, BI extrapola o passado e o presente para inferir previsões sobre o futuro. Apresenta-se dados passados para informações relevantes para ajudar no monitoramento das operações de negócio e para auxiliar os gestores na tomada de decisões de curto a médio prazo.
Em contraste, os praticantes da ciência centrada em dados para os negócios procuram fazer novas descobertas usando métodos matemáticos ou estatísticos avançados para analisar e gerar previsões de grandes quantidades de dados empresariais. Esses insights preditivos são geralmente relevantes para o futuro a longo prazo do negócio. Os cientistas de dados centrados nos negócios tentam descobrir novos paradigmas e novas maneiras de olhar para os dados para fornecer uma nova perspectiva sobre a organização, as suas operações e suas relações com clientes, fornecedores e concorrentes. Portanto, os cientistas de dados centrados nos negócios devem conhecer do negócio e seu meio ambiente. Eles devem ter conhecimento do negócio para determinar se uma descoberta é relevante para uma linha de negócios ou para a organização como um todo.
David Matos
Sensacional, me ajudou a definir o meu próximo passo acadêmico que será Ciências de Dados. Obrigado!
Alex,
Obrigado por acompanhar o blog. E acredito que você esteja fazendo uma excelente escolha, seguindo pelo fascinante caminho da Ciência de Dados.
Abs
David
Ótimo texto, com toda certeza foi um investimento de tempo lendo este material. Show de bola
Valeu. Obrigado!
Estou preste a se matricular na pós-graduação, porém ainda estava na dúvida sobre a diferença entre o BI e o Cientista de dados. Esse texto com certeza me ajudou a escolher.
Legal Bruno. Bom saber que foi útil. Abs
Excelente conteúdo, mas ainda estou com dúvida.
Trabalho com marketing digital e uma breve análise de dados até consigo fazer, porém acredito que quanto mais análise de dados mais eu conseguirei tomar melhor minhas decisões.
Para o meu caso. Qual seria o melhor caminho?
Novamente, parabéns pelo trabalho.
Obrigado Alex. Ciência de Dados é o caminho, sem dúvida.
Olá David, excelente matéria.
Tenho formação em engenharia civil, mas quero ingressar na área tecnológica, mais precisamente como Cientista de Dados. Gostaria de saber se, na sua opinião, necessito fazer uma graduação na área (ADS ou SI por exemplo), ou se já posso ir direto para uma pós ou MBA de Data Science?
Outra dúvida, se seria fácil me ingressar na área sem experiência prévia, dado a escassez de profissionais?
Muito obrigado!
Olá Diego. Obrigado. Não acho que um curso de graduação ou MBA vá agregar muito. Você vai aprender muita teoria e pouco foco em atividades voltadas ao mercado de trabalho. Eu focaria em um curso prático, onde você experimentar rapidamente o que é Ciência de Dados. Cursos como da Data Science Academy (www.datascienceacademy.com.br) vão te dar uma visão clara do que faz um profissional de Ciência de Dados e aí você pode decidir se vale a pena buscar uma graduação ou MBA. Entrar no mercado depende mais do conhecimento do que qualquer outra coisa, devido à grande escassez de profissionais. Boa sorte.
Adorei esta matéria esclarecedora. Como um dos leitores também estou em dúvidas entre BI e CD, mas ainda gostaria de esclarecer uma dúvida.
A tendência para o TI está cada dia mais forte, qual destas duas áreas neste momento é mais promissora?
Olá Priscila. A área de Data Science é a mais promissora no momento. O mercado está fervilhando e há carência de profissionais no mercado.