O Poder do Open Data

O Poder do Open Data

Open data (também chamado public datasets) faz parte de uma tendência em direção a um conceito mais amplo sobre o que é propriedade intelectual, uma tendência que tem ganhado enorme popularidade ao longo da última década. Dados abertos são dados que foram disponibilizadas ao público e que podem ser utilizados, reutilizados, analisados

Apache Spark e Data Science

Apache Spark e Data Science

A análise de dados tem crescido a cada dia e várias ferramentas tem surgido para auxiliar aqueles que trabalham com dados. Uma destas ferramentas é o Apache Spark. Spark é um projeto open source, mantido por uma comunidade de desenvolvedores que foi criado em 2009 na Universidade da Califórnia, Berkeley.

Usando Python em Data Science

Usando Python em Data Science

Se você estiver pensando em aprender Python como sua linguagem de programação para Data Science, uma pergunta pode ajudar neste processo: “Quais são as diferentes bibliotecas Python disponíveis para realizar a análise de dados?” Existem muitas bibliotecas disponíveis para realizar a análise de dados em Python. Pode não ser necessário

A Arte da Ciência de Dados

A Arte da Ciência de Dados

Ciência de Dados é uma mistura de arte com engenharia. Reconhecer padrões nos dados, considerar que questionamentos devem ser feitos e determinar o melhor algoritmo para extrair a informação, seria o lado “arte” da Ciência de Dados. Entretanto, para que a arte seja realmente útil, o lado engenharia determina os

Chief Data Officer

Chief Data Officer

Embora o volume de dados aumente a cada dia, o que requer investimento em armazenamento e análise, a má gestão dos dados ainda tem sido o que mais se vê no ambiente corporativo. Gerenciar dados custa caro e de acordo com o Gartner, estima-se um prejuízo na ordem de 13

R ou Python para Análise de Dados?

R ou Python para Análise de Dados?

Quando se trata de Ciência de Dados, uma pergunta sempre vem à tona: R ou Python para análise de dados? Apesar de existirem muitas outras possibilidades, estas duas linguagens tem polarizado as discussões sobre que ferramenta utilizar para análise. As duas linguagens são simples (e gratuitas) para instalar e relativamente fáceis de começar a

Predictive Analytics

Predictive Analytics

Predictive Analytics (Análise Preditiva) é a prática de extrair informações de conjuntos de dados, a fim de determinar padrões e resultados futuros. Perceba que não existe mágica: o Predictive Analytics não prevê o que vai acontecer exatamente no futuro. Ele prevê o que pode acontecer no futuro com um nível