Business Intelligence x Data Science

Business Intelligence x Data Science

Business Intelligence e Data Science tem muita coisa em comum e Cientistas de Dados focados em negócios e Analistas de Negócios que trabalham com Business Intelligence são como primos. Ambos usam dados para trabalhar para o mesmo objetivo, mas a sua abordagem, tecnologia e função diferem de diversas maneiras. Vamos definir, comparar e diferenciar Business Intelligence de Data Science.

Business Intelligence

O objetivo do Business Intelligence (BI) é converter dados brutos em insights de negócio que os líderes empresariais e gestores possam usar para tomar decisões. Os analistas de negócios usam ferramentas de BI para criar produtos de apoio à tomada de decisão e gestão. Se você quer construir dashboards de suporte à decisão, visualizações ou relatórios a partir de conjuntos médios de dados estruturados de negócio, então você pode usar ferramentas de BI e métodos para isso. Business Intelligence é composto basicamente de:

Dados internos – dados coletados dentro da organização, gerados por colaboradores, gestores, sistemas e stakeholders em geral.

Tecnologias e ferramentas – OLAP (online analytical process), ETL (extract, transforming and loading), Data Warehousing, business applications.

Tipos de dados usados em Business Intelligence

Insights que são gerados em Business Intelligence são derivados de conjuntos de tamanho padrão de dados de negócio estruturados. Soluções de BI são principalmente construídas à parte de dados transacionais – dados que são gerados durante o curso de um evento de transação, como dados gerados durante uma venda, ou durante uma transferência de dinheiro entre contas bancárias, por exemplo. Dado transacional é um subproduto natural de atividades empresariais que ocorrem em toda a organização, e todos os tipos de inferências podem ser derivadas dela. Você pode usar o BI para obter os seguintes tipos de informação:

Customer service data – respondendo à questão: “ Que áreas de negócio estão causando maior tempo de espera de nossos usuários? ”

Sales and marketing data – respondendo à questão: “ Que estratégias de marketing são mais efetivas e porque? “

Operational data – respondendo à questão: “ Qual o nível de eficiência da operação de help-desk? ”

Employee performance data – respondendo à questão: “ Que colaboradores são mais produtivos? ”

Tecnologias e skills usados em Business Intelligence

Para agilizar o trabalho da área de BI, as empresas precisam se certificar que os dados estejam organizados para facilidade de acesso e apresentação. Pode-se usar bancos de dados multidimensionais para isso. Ao contrário de bancos de dados relacionais, bancos de dados multidimensionais organizam os dados em cubos que são armazenados como matrizes multi-dimensionais. Para que as equipes de BI possam ser capazes de trabalhar com os dados o mais rápido e fácil possível, pode-se usar bancos de dados multidimensionais para armazenar dados em um cubo, em vez de armazenar os dados em vários bancos de dados relacionais que podem ou não ser compatíveis uns com os outros.

Esta estrutura de dados em cubo, permite a utilização de Online Analytical Processing (OLAP) – uma tecnologia através da qual você pode rapidamente e facilmente acessar e usar seus dados para todos os tipos de diferentes operações e análises. Para ilustrar o conceito de OLAP, imagine que você tem um cubo de dados de vendas que tem três dimensões – tempo, região e unidade de negócio. Você pode dividir os dados para ver apenas um quadrado – para ver uma região de vendas, por exemplo. Você pode cortar os dados para ver um cubo menor composto de um subconjunto de tempo, uma região e uma unidade de negócio. Você pode pesquisar para baixo ou para cima para ver os dados, de forma altamente detalhada ou muito resumida, respectivamente. E você pode totalizar, os números ao longo de uma dimensão – para números totais em unidades de negócio, por exemplo, ou para ver as vendas através do tempo e região apenas.

OLAP é apenas um tipo de sistema de armazenamento de dados – um repositório centralizado de dados que você pode usar para armazenar e acessar seus dados. Um sistema de armazenamento de dados mais tradicional comumente empregado em soluções de BI é uma Data Mart – um sistema de armazenamento de dados que você pode usar para armazenar uma área de foco particular de dados, pertencente a uma única linha de negócios na empresa. ETL (extrair, transformar e carregar) é o processo usado para extrair dados, transformá-lo e carregá-lo em seu banco de dados ou Data Warehouse. Os analistas de negócios geralmente têm habilidades e treinamento em negócios e tecnologia da informação. Como uma disciplina, BI depende de tecnologias tradicionais de TI e habilidades específicas.

Data Science

Dentro da empresa, a ciência de dados tem a mesma finalidade que o Business Intelligence – converter dados brutos em insights de negócios que os líderes empresariais e gestores podem usar para tomar decisões baseadas em dados. Se você tem grandes conjuntos de fontes de dados estruturados e não estruturados que podem ou não estar completos e você deseja converter essas fontes em informações valiosas para apoio à decisão em toda a empresa, recorra a um cientista de dados. Ciência de dados centrada em negócio é multidisciplinar e integra os seguintes elementos:

Quantitative analysis – modelagem matemática, análise estatística, previsões e simulações.

Programming skills – habilidades em programação para analisar dados brutos e torná-los acessíveis aos usuários de negócio.

Business knowledge – conhecimento do ambiente de negócio, para melhor compreender a relevância dos resultados encontrados.

Ciência de Dados é uma disciplina pioneira. Cientistas de dados muitas vezes empregam o método científico para a exploração de dados, formação de hipóteses e testes de hipóteses (através de simulação e modelagem estatística). Cientistas de dados com foco de negócios geram conhecimentos valiosos, muitas vezes, explorando padrões e anomalias em dados de negócios. Ciência dados em um contexto de negócios é comumente composta de:

Conjuntos de dados internos e externos – Ciência de dados é flexível. Você pode criar dados corporativos mashups a partir de fontes internas e externas de dados estruturados e não estruturados com bastante facilidade (dados mashup é uma combinação de duas ou mais fontes de dados, que são analisadas em conjunto, a fim de fornecer aos usuários uma visão mais completa da situação em foco).

Tecnologias e ferramentas – Exemplos aqui poderiam envolver o uso de plataformas baseadas em nuvem, programação matemática, estatística e de aprendizado de máquina, de análise de dados utilizando Python e R e de visualização de dados avançados.

Como analistas de negócios, cientistas de dados centrados no negócio produzem produtos de apoio à decisão para os gerentes de negócios e líderes organizacionais. Estes produtos incluem analytics dashboards e visualizações de dados, relatórios não tabulares e tabelas.

Tipos de dados usados em Data Science

Você pode usar a ciência de dados para obter insights de negócios a partir de conjuntos de tamanho padrão de dados de negócios estruturados (assim como BI) ou a partir de conjuntos estruturados, semi-estruturados, não estruturados e Big Data. Soluções de ciências dados não se limitam aos dados transacionais; você pode usar a ciência para criar valiosos insights de todas as fontes de dados disponíveis. Essas fontes de dados incluem:

Transactional business data – Uma fonte de dados de negócio transacional é o mesmo tipo de dados estruturados utilizados em BI tradicional e inclui dados de gerenciamento, atendimento ao cliente, vendas e dados de marketing, dados operacionais e dados de desempenho do empregado.

Social and related to the brand or business – dados não estruturados gerados a partir de e-mails, instant messaging (Skype) e redes sociais Twitter, Facebook, LinkedIn, Pinterest e Instagram.

Machine data from business operations – dados não estruturados gerados automaticamente por máquinas, tal como dados de sensores de automóveis, por exemplo.

Audio, video, image e pdf file data – fontes de dados comuns e bem estabelecidas.

Tecnologias e skills usados em Data Science

Uma vez que os produtos da ciência de dados muitas vezes são gerados a partir de Big Data, soluções de plataforma de dados baseado em nuvem são comuns neste campo. Os dados que são usados na ciência dados são frequentemente derivados de soluções como Hadoop, MapReduce e processamento paralelo. Cientistas de dados devem possuir visão de inovadora e devem pensar fora da caixa, a fim de exigir soluções para os problemas que resolvem. Muitos cientistas de dados tendem para soluções de código aberto quando disponíveis. A partir de uma perspectiva de custo, esta abordagem beneficia as organizações que empregam esses cientistas.

Cientistas de dados com foco em negócios podem usar técnicas de aprendizado de máquina (Machine Learning) para encontrar padrões e obter insights de grandes conjuntos de dados que estão relacionados com uma linha de negócio específica ou o negócio em geral. Eles são qualificados em matemática, estatística e programação, e eles às vezes usam essas habilidades para gerar modelos preditivos. Eles geralmente sabem como programar em Python ou R. A maioria deles sabe como usar SQL para consultar dados relevantes.

Resumindo

As semelhanças entre BI e Ciência de Dados focada nos negócios são bastante claras. O objetivo de ambos, BI e Ciência centrada em dados para os negócios, é converter dados brutos em insights que os gerentes e líderes podem usar para apoio na tomada de decisão de negócios.

BI

Data Science

Business Intelligence x Data Science diferem no que diz respeito a utilização dos dados. Apesar de BI poder utilizar métodos para previsão de futuro, esses métodos são gerados para fazer inferências simples a partir de dados históricos ou atuais. Desta forma, BI extrapola o passado e o presente para inferir previsões sobre o futuro. Apresenta-se dados passados para informações relevantes para ajudar no monitoramento das operações de negócio e para auxiliar os gestores na tomada de decisões de curto a médio prazo.

Em contraste, os praticantes da ciência centrada em dados para os negócios procuram fazer novas descobertas usando métodos matemáticos ou estatísticos avançados para analisar e gerar previsões de grandes quantidades de dados empresariais. Esses insights preditivos são geralmente relevantes para o futuro a longo prazo do negócio. Os cientistas de dados centrados nos negócios tentam descobrir novos paradigmas e novas maneiras de olhar para os dados para fornecer uma nova perspectiva sobre a organização, as suas operações e suas relações com clientes, fornecedores e concorrentes. Portanto, os cientistas de dados centrados nos negócios devem conhecer do negócio e seu meio ambiente. Eles devem ter conhecimento do negócio para determinar se uma descoberta é relevante para uma linha de negócios ou para a organização como um todo.

David Matos

4 comments

    1. Alex,

      Obrigado por acompanhar o blog. E acredito que você esteja fazendo uma excelente escolha, seguindo pelo fascinante caminho da Ciência de Dados.

      Abs

      David

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *