Data Science com Scala – Scalable Language

Data Science com Scala (Scalable Language)

Tem havido ultimamente, muita discussão sobre linguagens de programação utilizadas em Data Science. Python e R são as mais populares entre os Cientistas de Dados, enquanto o Java tem sido a linguagem usada para aplicativos e desenvolvimento sobre Hadoop. Mas existem outras opções que merecem ser consideradas. Uma destas opções

Data Lake, a fonte do Big Data

Data Lake, a fonte do Big Data

Data Lake é um termo recente, criado pelo CTO (Chief Technical Officer) do Pentaho, James Dixon, para descrever um componente importante no universo da análise de dados e do Big Data. A ideia é ter um único repositório dentro da empresa, para que todos os dados brutos estejam disponíveis a

Big Data como Serviço

Big Data como Serviço

O mundo da tecnologia anda em uma velocidade cada vez maior. Isso é fato. E quanto mais conhecimento é gerado, mais soluções que nunca haviam sido pensadas (talvez porque os problemas se quer existiam), vão sendo criadas. E com a Ciência de Dados não tem sido diferente. Eu acredito que

Carreiras em Data Science

Carreiras em Data Science

Com a explosão da análise de dados e do Big Data, a busca por profissionais capazes de extrair, analisar e gerar insights dos dados, não para de crescer. Veja este gráfico do site de empregos Indeed. É como se o mercado tivesse acordado de um sono profundo e percebido que

O Poder do Open Data

O Poder do Open Data

Open data (também chamado public datasets) faz parte de uma tendência em direção a um conceito mais amplo sobre o que é propriedade intelectual, uma tendência que tem ganhado enorme popularidade ao longo da última década. Dados abertos são dados que foram disponibilizadas ao público e que podem ser utilizados, reutilizados, analisados

Apache Spark e Data Science

Apache Spark e Data Science

A análise de dados tem crescido a cada dia e várias ferramentas tem surgido para auxiliar aqueles que trabalham com dados. Uma destas ferramentas é o Apache Spark. Spark é um projeto open source, mantido por uma comunidade de desenvolvedores que foi criado em 2009 na Universidade da Califórnia, Berkeley.

Usando Python em Data Science

Usando Python em Data Science

Se você estiver pensando em aprender Python como sua linguagem de programação para Data Science, uma pergunta pode ajudar neste processo: “Quais são as diferentes bibliotecas Python disponíveis para realizar a análise de dados?” Existem muitas bibliotecas disponíveis para realizar a análise de dados em Python. Pode não ser necessário

A Arte da Ciência de Dados

A Arte da Ciência de Dados

Ciência de Dados é uma mistura de arte com engenharia. Reconhecer padrões nos dados, considerar que questionamentos devem ser feitos e determinar o melhor algoritmo para extrair a informação, seria o lado “arte” da Ciência de Dados. Entretanto, para que a arte seja realmente útil, o lado engenharia determina os