Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
Menu
Business Intelligence x Data Science

Business Intelligence x Data Science

Posted on 14 de setembro de 201527 de dezembro de 2017 by David Matos

Business Intelligence e Data Science tem muita coisa em comum e Cientistas de Dados focados em negócios e Analistas de Negócios que trabalham com Business Intelligence são como primos. Ambos usam dados para trabalhar para o mesmo objetivo, mas a sua abordagem, tecnologia e função diferem de diversas maneiras. Vamos definir, comparar e diferenciar Business Intelligence de Data Science.

Business Intelligence

O objetivo do Business Intelligence (BI) é converter dados brutos em insights de negócio que os líderes empresariais e gestores possam usar para tomar decisões. Os analistas de negócios usam ferramentas de BI para criar produtos de apoio à tomada de decisão e gestão. Se você quer construir dashboards de suporte à decisão, visualizações ou relatórios a partir de conjuntos médios de dados estruturados de negócio, então você pode usar ferramentas de BI e métodos para isso. Business Intelligence é composto basicamente de:

Dados internos – dados coletados dentro da organização, gerados por colaboradores, gestores, sistemas e stakeholders em geral.

Tecnologias e ferramentas – OLAP (online analytical process), ETL (extract, transforming and loading), Data Warehousing, business applications.

Tipos de dados usados em Business Intelligence

Insights que são gerados em Business Intelligence são derivados de conjuntos de tamanho padrão de dados de negócio estruturados. Soluções de BI são principalmente construídas à parte de dados transacionais – dados que são gerados durante o curso de um evento de transação, como dados gerados durante uma venda, ou durante uma transferência de dinheiro entre contas bancárias, por exemplo. Dado transacional é um subproduto natural de atividades empresariais que ocorrem em toda a organização, e todos os tipos de inferências podem ser derivadas dela. Você pode usar o BI para obter os seguintes tipos de informação:

Customer service data – respondendo à questão: “ Que áreas de negócio estão causando maior tempo de espera de nossos usuários? ”

Sales and marketing data – respondendo à questão: “ Que estratégias de marketing são mais efetivas e porque? “

Operational data – respondendo à questão: “ Qual o nível de eficiência da operação de help-desk? ”

Employee performance data – respondendo à questão: “ Que colaboradores são mais produtivos? ”

Tecnologias e skills usados em Business Intelligence

Para agilizar o trabalho da área de BI, as empresas precisam se certificar que os dados estejam organizados para facilidade de acesso e apresentação. Pode-se usar bancos de dados multidimensionais para isso. Ao contrário de bancos de dados relacionais, bancos de dados multidimensionais organizam os dados em cubos que são armazenados como matrizes multi-dimensionais. Para que as equipes de BI possam ser capazes de trabalhar com os dados o mais rápido e fácil possível, pode-se usar bancos de dados multidimensionais para armazenar dados em um cubo, em vez de armazenar os dados em vários bancos de dados relacionais que podem ou não ser compatíveis uns com os outros.

Esta estrutura de dados em cubo, permite a utilização de Online Analytical Processing (OLAP) – uma tecnologia através da qual você pode rapidamente e facilmente acessar e usar seus dados para todos os tipos de diferentes operações e análises. Para ilustrar o conceito de OLAP, imagine que você tem um cubo de dados de vendas que tem três dimensões – tempo, região e unidade de negócio. Você pode dividir os dados para ver apenas um quadrado – para ver uma região de vendas, por exemplo. Você pode cortar os dados para ver um cubo menor composto de um subconjunto de tempo, uma região e uma unidade de negócio. Você pode pesquisar para baixo ou para cima para ver os dados, de forma altamente detalhada ou muito resumida, respectivamente. E você pode totalizar, os números ao longo de uma dimensão – para números totais em unidades de negócio, por exemplo, ou para ver as vendas através do tempo e região apenas.

OLAP é apenas um tipo de sistema de armazenamento de dados – um repositório centralizado de dados que você pode usar para armazenar e acessar seus dados. Um sistema de armazenamento de dados mais tradicional comumente empregado em soluções de BI é uma Data Mart – um sistema de armazenamento de dados que você pode usar para armazenar uma área de foco particular de dados, pertencente a uma única linha de negócios na empresa. ETL (extrair, transformar e carregar) é o processo usado para extrair dados, transformá-lo e carregá-lo em seu banco de dados ou Data Warehouse. Os analistas de negócios geralmente têm habilidades e treinamento em negócios e tecnologia da informação. Como uma disciplina, BI depende de tecnologias tradicionais de TI e habilidades específicas.

Data Science

Dentro da empresa, a ciência de dados tem a mesma finalidade que o Business Intelligence – converter dados brutos em insights de negócios que os líderes empresariais e gestores podem usar para tomar decisões baseadas em dados. Se você tem grandes conjuntos de fontes de dados estruturados e não estruturados que podem ou não estar completos e você deseja converter essas fontes em informações valiosas para apoio à decisão em toda a empresa, recorra a um cientista de dados. Ciência de dados centrada em negócio é multidisciplinar e integra os seguintes elementos:

Quantitative analysis – modelagem matemática, análise estatística, previsões e simulações.

Programming skills – habilidades em programação para analisar dados brutos e torná-los acessíveis aos usuários de negócio.

Business knowledge – conhecimento do ambiente de negócio, para melhor compreender a relevância dos resultados encontrados.

Ciência de Dados é uma disciplina pioneira. Cientistas de dados muitas vezes empregam o método científico para a exploração de dados, formação de hipóteses e testes de hipóteses (através de simulação e modelagem estatística). Cientistas de dados com foco de negócios geram conhecimentos valiosos, muitas vezes, explorando padrões e anomalias em dados de negócios. Ciência dados em um contexto de negócios é comumente composta de:

Conjuntos de dados internos e externos – Ciência de dados é flexível. Você pode criar dados corporativos mashups a partir de fontes internas e externas de dados estruturados e não estruturados com bastante facilidade (dados mashup é uma combinação de duas ou mais fontes de dados, que são analisadas em conjunto, a fim de fornecer aos usuários uma visão mais completa da situação em foco).

Tecnologias e ferramentas – Exemplos aqui poderiam envolver o uso de plataformas baseadas em nuvem, programação matemática, estatística e de aprendizado de máquina, de análise de dados utilizando Python e R e de visualização de dados avançados.

Como analistas de negócios, cientistas de dados centrados no negócio produzem produtos de apoio à decisão para os gerentes de negócios e líderes organizacionais. Estes produtos incluem analytics dashboards e visualizações de dados, relatórios não tabulares e tabelas.

Tipos de dados usados em Data Science

Você pode usar a ciência de dados para obter insights de negócios a partir de conjuntos de tamanho padrão de dados de negócios estruturados (assim como BI) ou a partir de conjuntos estruturados, semi-estruturados, não estruturados e Big Data. Soluções de ciências dados não se limitam aos dados transacionais; você pode usar a ciência para criar valiosos insights de todas as fontes de dados disponíveis. Essas fontes de dados incluem:

Transactional business data – Uma fonte de dados de negócio transacional é o mesmo tipo de dados estruturados utilizados em BI tradicional e inclui dados de gerenciamento, atendimento ao cliente, vendas e dados de marketing, dados operacionais e dados de desempenho do empregado.

Social and related to the brand or business – dados não estruturados gerados a partir de e-mails, instant messaging (Skype) e redes sociais Twitter, Facebook, LinkedIn, Pinterest e Instagram.

Machine data from business operations – dados não estruturados gerados automaticamente por máquinas, tal como dados de sensores de automóveis, por exemplo.

Audio, video, image e pdf file data – fontes de dados comuns e bem estabelecidas.

Tecnologias e skills usados em Data Science

Uma vez que os produtos da ciência de dados muitas vezes são gerados a partir de Big Data, soluções de plataforma de dados baseado em nuvem são comuns neste campo. Os dados que são usados na ciência dados são frequentemente derivados de soluções como Hadoop, MapReduce e processamento paralelo. Cientistas de dados devem possuir visão de inovadora e devem pensar fora da caixa, a fim de exigir soluções para os problemas que resolvem. Muitos cientistas de dados tendem para soluções de código aberto quando disponíveis. A partir de uma perspectiva de custo, esta abordagem beneficia as organizações que empregam esses cientistas.

Cientistas de dados com foco em negócios podem usar técnicas de aprendizado de máquina (Machine Learning) para encontrar padrões e obter insights de grandes conjuntos de dados que estão relacionados com uma linha de negócio específica ou o negócio em geral. Eles são qualificados em matemática, estatística e programação, e eles às vezes usam essas habilidades para gerar modelos preditivos. Eles geralmente sabem como programar em Python ou R. A maioria deles sabe como usar SQL para consultar dados relevantes.

Resumindo

As semelhanças entre BI e Ciência de Dados focada nos negócios são bastante claras. O objetivo de ambos, BI e Ciência centrada em dados para os negócios, é converter dados brutos em insights que os gerentes e líderes podem usar para apoio na tomada de decisão de negócios.

BI

Data Science

Business Intelligence x Data Science diferem no que diz respeito a utilização dos dados. Apesar de BI poder utilizar métodos para previsão de futuro, esses métodos são gerados para fazer inferências simples a partir de dados históricos ou atuais. Desta forma, BI extrapola o passado e o presente para inferir previsões sobre o futuro. Apresenta-se dados passados para informações relevantes para ajudar no monitoramento das operações de negócio e para auxiliar os gestores na tomada de decisões de curto a médio prazo.

Em contraste, os praticantes da ciência centrada em dados para os negócios procuram fazer novas descobertas usando métodos matemáticos ou estatísticos avançados para analisar e gerar previsões de grandes quantidades de dados empresariais. Esses insights preditivos são geralmente relevantes para o futuro a longo prazo do negócio. Os cientistas de dados centrados nos negócios tentam descobrir novos paradigmas e novas maneiras de olhar para os dados para fornecer uma nova perspectiva sobre a organização, as suas operações e suas relações com clientes, fornecedores e concorrentes. Portanto, os cientistas de dados centrados nos negócios devem conhecer do negócio e seu meio ambiente. Eles devem ter conhecimento do negócio para determinar se uma descoberta é relevante para uma linha de negócios ou para a organização como um todo.

David Matos

Relacionado

16 thoughts on “Business Intelligence x Data Science”

  1. Alex Sandro disse:
    4 de janeiro de 2016 às 2:10 PM

    Sensacional, me ajudou a definir o meu próximo passo acadêmico que será Ciências de Dados. Obrigado!

    Responder
    1. David Matos disse:
      4 de janeiro de 2016 às 3:11 PM

      Alex,

      Obrigado por acompanhar o blog. E acredito que você esteja fazendo uma excelente escolha, seguindo pelo fascinante caminho da Ciência de Dados.

      Abs

      David

      Responder
  2. Pingback: Do Data Warehouse para o Data Lake | Ciência e Dados
  3. Pingback: Matéria: Business Intelligence x Data Science – PECID
  4. Atilas Paiva disse:
    9 de março de 2018 às 11:36 AM

    Ótimo texto, com toda certeza foi um investimento de tempo lendo este material. Show de bola

    Responder
    1. David Matos disse:
      9 de março de 2018 às 1:09 PM

      Valeu. Obrigado!

      Responder
  5. Bruno Lira disse:
    10 de abril de 2018 às 2:49 PM

    Estou preste a se matricular na pós-graduação, porém ainda estava na dúvida sobre a diferença entre o BI e o Cientista de dados. Esse texto com certeza me ajudou a escolher.

    Responder
    1. David Matos disse:
      11 de abril de 2018 às 11:56 AM

      Legal Bruno. Bom saber que foi útil. Abs

      Responder
  6. Pingback: O que é data science? O guia completo sobre o assunto – My Blog
  7. Alex disse:
    5 de fevereiro de 2020 às 2:27 PM

    Excelente conteúdo, mas ainda estou com dúvida.

    Trabalho com marketing digital e uma breve análise de dados até consigo fazer, porém acredito que quanto mais análise de dados mais eu conseguirei tomar melhor minhas decisões.

    Para o meu caso. Qual seria o melhor caminho?

    Novamente, parabéns pelo trabalho.

    Responder
    1. David Matos disse:
      6 de fevereiro de 2020 às 11:16 PM

      Obrigado Alex. Ciência de Dados é o caminho, sem dúvida.

      Responder
    2. Dhiego disse:
      13 de maio de 2020 às 11:07 AM

      Olá David, excelente matéria.
      Tenho formação em engenharia civil, mas quero ingressar na área tecnológica, mais precisamente como Cientista de Dados. Gostaria de saber se, na sua opinião, necessito fazer uma graduação na área (ADS ou SI por exemplo), ou se já posso ir direto para uma pós ou MBA de Data Science?
      Outra dúvida, se seria fácil me ingressar na área sem experiência prévia, dado a escassez de profissionais?
      Muito obrigado!

      Responder
      1. David Matos disse:
        13 de maio de 2020 às 11:33 PM

        Olá Diego. Obrigado. Não acho que um curso de graduação ou MBA vá agregar muito. Você vai aprender muita teoria e pouco foco em atividades voltadas ao mercado de trabalho. Eu focaria em um curso prático, onde você experimentar rapidamente o que é Ciência de Dados. Cursos como da Data Science Academy (www.datascienceacademy.com.br) vão te dar uma visão clara do que faz um profissional de Ciência de Dados e aí você pode decidir se vale a pena buscar uma graduação ou MBA. Entrar no mercado depende mais do conhecimento do que qualquer outra coisa, devido à grande escassez de profissionais. Boa sorte.

        Responder
  8. Priscila disse:
    13 de fevereiro de 2020 às 12:49 PM

    Adorei esta matéria esclarecedora. Como um dos leitores também estou em dúvidas entre BI e CD, mas ainda gostaria de esclarecer uma dúvida.
    A tendência para o TI está cada dia mais forte, qual destas duas áreas neste momento é mais promissora?

    Responder
    1. David Matos disse:
      14 de fevereiro de 2020 às 4:05 AM

      Olá Priscila. A área de Data Science é a mais promissora no momento. O mercado está fervilhando e há carência de profissionais no mercado.

      Responder
  9. Pingback: Data Warehouse em Nuvem com o Amazon Redshift — Ciência e Dados

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Assinar blog por e-mail

Digite seu endereço de e-mail para assinar este blog e receber notificações de novas publicações por e-mail.

Buscar

Twitter

Meus Tuítes

Tags Mais Comuns nos Posts

Anaconda Analytics Análise de Negócios Apache Spark AWS Big Data Blockchain Business Intelligence ChatGPT Chief Data Officer Cientista de Dados Cientistas de Dados Ciência de Dados Cloud Computing Data Lake Data Mesh Data Science Data Scientist Data Warehouse Deep Learning Deploy Descriptive Analytics Diagnostic Analytics Engenharia de Dados Engenheiro de Dados Estatística GPU Hadoop Inteligência Artificial Internet of Things Linguagem Python Linguagem R Machine Learning MapReduce Metadados NoSQL NVIDIA Open Data Oracle Predictive Analytics Prescriptive Analytics Probabilidade Python Salários Data Science Visualização

Histórico de Posts

  • março 2023 (3)
  • fevereiro 2023 (3)
  • janeiro 2023 (5)
  • dezembro 2022 (8)
  • novembro 2022 (7)
  • outubro 2022 (2)
  • setembro 2022 (3)
  • agosto 2022 (2)
  • julho 2022 (2)
  • junho 2022 (3)
  • maio 2022 (1)
  • abril 2022 (3)
  • março 2022 (1)
  • fevereiro 2022 (3)
  • janeiro 2022 (2)
  • dezembro 2021 (1)
  • novembro 2021 (5)
  • outubro 2021 (2)
  • setembro 2021 (3)
  • agosto 2021 (1)
  • junho 2021 (1)
  • fevereiro 2021 (2)
  • janeiro 2021 (1)
  • dezembro 2020 (1)
  • novembro 2020 (1)
  • outubro 2020 (2)
  • agosto 2020 (1)
  • abril 2020 (1)
  • março 2020 (1)
  • fevereiro 2020 (2)
  • agosto 2019 (1)
  • abril 2019 (1)
  • setembro 2018 (2)
  • julho 2018 (1)
  • junho 2018 (3)
  • abril 2018 (1)
  • março 2018 (1)
  • fevereiro 2018 (2)
  • janeiro 2018 (1)
  • dezembro 2017 (1)
  • novembro 2017 (1)
  • outubro 2017 (1)
  • setembro 2017 (1)
  • julho 2017 (1)
  • junho 2017 (1)
  • maio 2017 (2)
  • abril 2017 (1)
  • janeiro 2017 (1)
  • novembro 2016 (1)
  • outubro 2016 (1)
  • setembro 2016 (1)
  • julho 2016 (1)
  • junho 2016 (1)
  • maio 2016 (1)
  • abril 2016 (1)
  • fevereiro 2016 (1)
  • janeiro 2016 (3)
  • dezembro 2015 (4)
  • novembro 2015 (6)
  • outubro 2015 (9)
  • setembro 2015 (9)
  • agosto 2015 (9)
©2022 Ciência e Dados
 

Carregando comentários...