O Hadoop está se tornando o coração da infraestrutura de Big Data (clique aqui para acessar o post com a introdução sobre Hadoop), o que vai revolucionar o sistema tradicional de armazenamento em bancos de dados como conhecemos hoje. Além de gratuito, o Hadoop foi criado para ser usado em hardware de baixo custo, uma…
Categoria: Hadoop
Apache Spark e Data Science
A análise de dados tem crescido a cada dia e várias ferramentas tem surgido para auxiliar aqueles que trabalham com dados. Uma destas ferramentas é o Apache Spark.
Processamento de Dados com Hadoop
Hadoop é uma solução open-source de processamento de dados que foi desenvolvida pela Apache Software Foundation e tem como principal objetivo o processamento de dados com alto volume e variedade por meio de computação de larga escala.
Processamento Distribuído com MapReduce
MapReduce foi projetado para usar computação paralela distribuída em Big Data e transformar os dados em pedaços menores.