O campo de Big Data exige cada vez mais clareza, por conta da variedade de termos utilizados para descrever esta tecnologia e por isso podemos até mesmo dizer que já existe um vocabulário básico do Big Data, próprio desta tecnologia. Este post lista todos os principais termos, direta ou indiretamente, envolvidas com Big Data, com…
Conceitos Fundamentais de Machine Learning
Se você está iniciando sua jornada no mundo do Machine Learning e suas aplicações, provavelmente já se deparou com alguns termos muito técnicos que são muitas vezes de difícil compreensão. Neste post, vou descrever alguns conceitos fundamentais de Machine Learning e suas respectivas aplicações. De forma bem simples, Machine Learning é um conjunto de regras…
Conceitos Fundamentais de Estatística
Vamos abrir uma série de artigos sobre conceitos básicos de Estatística, que são fundamentais no universo da Ciência de Dados. Neste primeiro artigo, vamos falar sobre Descriptive statistics vs Inferential statistics (Estatística Descritiva vs Estatística Inferencial). Probabilidade é um dos conceitos mais básicos e fundamentais na Estatística. Até mesmo para começar a entender o sentido dos seus…
Business Intelligence x Data Science
Business Intelligence e Data Science tem muita coisa em comum e Cientistas de Dados focados em negócios e Analistas de Negócios que trabalham com Business Intelligence são como primos. Ambos usam dados para trabalhar para o mesmo objetivo, mas a sua abordagem, tecnologia e função diferem de diversas maneiras. Vamos definir, comparar e diferenciar Business…
Tipos de Analytics
Cientistas de dados centrados em negócios utilizam análise de dados para gerar insights a partir de dados brutos e obter informação que gere benefício para as organizações. Os tipos de análise abaixo, são os mais comuns e estão listados em ordem crescente de complexidade: Análise Descritiva (Descriptive Analytics): Este tipo de análise responde à pergunta:…
Ciência de Dados Centrada em Negócios
Para a maioria dos gerentes e diretores de grandes e médias empresas, a Ciência de Dados é interessante por causa dos benefícios que ela pode gerar. A maioria dos gerentes de negócios e líderes organizacionais não poderia se importar menos sobre codificação e algoritmos estatísticos complexos. Eles são, por outro lado, extremamente interessados em encontrar…
A Internet das Coisas (IoT – Internet of Things)
A Internet das Coisas (IoT – Internet of Things) é um cenário em que os objetos, animais e pessoas possuem identificadores únicos e a capacidade de transferir dados através de uma rede sem a necessidade de interação humana.
Processamento de Dados com Hadoop
Hadoop é uma solução open-source de processamento de dados que foi desenvolvida pela Apache Software Foundation e tem como principal objetivo o processamento de dados com alto volume e variedade por meio de computação de larga escala.
Processamento Distribuído com MapReduce
MapReduce foi projetado para usar computação paralela distribuída em Big Data e transformar os dados em pedaços menores.
Big Data’s 4 Vs
Os 4 Vs do Big Data são: Volume, Variety, Velocity e Veracity.










