Predictive Analytics (Análise Preditiva) é a prática de extrair informações de conjuntos de dados, a fim de determinar padrões e resultados futuros. Perceba que não existe mágica: o Predictive Analytics não prevê o que vai acontecer exatamente no futuro. Ele prevê o que pode acontecer no futuro com um nível aceitável de confiabilidade e inclui cenários hipotéticos e avaliação de riscos.
Predictive Analytics é realizada através de uma série de técnicas analíticas e estatísticas, utilizadas para o desenvolvimento de modelos que podem prever eventos futuros a partir de comportamentos diários, incluindo análise time-series ou modelos de regressão avançados. Existem diferentes formas de modelos preditivos, que variam de acordo com o evento ou comportamento que está sendo previsto. Quase todos os modelos preditivos produzem uma pontuação; uma pontuação mais elevada indica que um dado evento ou comportamento é muito provável que ocorra.
Aplicada aos negócios, análise preditiva é usada para analisar dados atuais e fatos históricos, a fim de compreender melhor os clientes, produtos e parceiros e para identificar riscos e oportunidades potenciais para uma empresa. Utiliza-se uma série de técnicas, incluindo a mineração de dados, modelagem estatística e Machine Learning para ajudar os analistas a realizarem previsões de negócios futuros.
Predictive Analytics e Big Data
Predictive Analytics é um facilitador do Big Data: empresas coletam grandes quantidades de dados de clientes em tempo real e Predictive Analytics usa dados históricos, combinados com esses dados em tempo real, para prever eventos futuros. A análise preditiva permite que as empresas utilizem Big Data (dados armazenados e em tempo real) para se deslocar de uma visão histórica a uma análise prospectiva do cliente.
Por exemplo, as lojas que utilizam dados de programas de fidelidade podem analisar qual foi o comportamento de compra dos clientes no passado e prever que promoções os clientes tendem a aderir no futuro. A análise preditiva também está sendo aplicada para análise do comportamento dos usuários em websites e como eles usam seus “cliques” com o mouse. Isso permite personalizar a experiência de cada usuário no website, como se fosse um website único para cada cliente. Isso é realmente fantástico.
Soluções de Predictive Analytics
Existem diversas soluções no Mercado e a cada dia novas soluções surgem. Fica difícil para os analistas escolherem a melhor (o que alias vai depender do objetivo final da análise e do orçamento disponível). Abaixo as principais soluções de Predictive Analytics, free e proprietárias.
Free:
- R – sem dúvida uma das mais utilizadas atualmente e a base para muitas outras soluções (inclusive as proprietárias)
- Orange – ferramenta de visualização e análise. O data mining pode ser feito utilizando scripts em Python.
- Weka – conjunto de algoritmos para Machine learning e data mining
- Octave – o Octave é muito parecido com o Matlab
- Data Science Studio (DSS Community Edition) – plataforma com todas as ferramentas necessárias para análise de Big Data e geração rápida de resultados de análise.
- Apache Spark MLlib – engine para processamento em larga escala, com diversos algoritmos poderosos para análise de regressão, classificação, naive bayes e muito mais.
- NumPy e SciPy – pacotes de computação científica em Python.
Proprietárias:
- SAS Predictive Analytics
- IBM Predictive Analytics
- SAP Predictive Analytics
- STATISTICA
- MATLAB
- Minitab
- RapidMiner
- GraphLab Create
- Oracle Data Mining (ODM)
- TIBCO Analytics
- Data Science Studio
A lista é bem mais longa e muitas soluções estão disponíveis. Recomendo uma visita a estes dois links abaixo, para uma visão geral e uma lista completa das soluções de Predictive Analytics, bem como uma análise e pontuação para cada uma delas. Até o próximo post!
Top 20 Predictive Analytics Freeware Software
Top 31 Predictive Analytics Software
David Matos