Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
Menu
Soluções Comerciais de Big Data

Soluções Comerciais de Big Data

Posted on 16 de dezembro de 201527 de dezembro de 2017 by David Matos

O Hadoop está se tornando o coração da infraestrutura de Big Data (clique aqui para acessar o post com a introdução sobre Hadoop), o que vai revolucionar o sistema tradicional de armazenamento em bancos de dados como conhecemos hoje. Além de gratuito, o Hadoop foi criado para ser usado em hardware de baixo custo, uma combinação essencial para empresas que buscam reduzir seus custos de infraestrutura de TI e ainda capitalizar os benefícios do Big Data.

Hadoop é usado principalmente por empresas que lidam com grandes quantidades de dados, sendo usado para o processamento dos dados, análises e geração de relatórios. Atualmente todas as organizações líderes em seus segmentos, incluindo Facebook, Google, Yahoo, Amazon, IBM, New York Times, etc… estão usando Hadoop.

O Hadoop MapReduce é uma das armas secretas do Google, por exemplo. Ele é utilizado para dividir o grande volume de dados do sistema de busca, em pedaços menores e, portanto, mais fáceis para processamento. O Hadoop é um projeto open-source.

Mas você pode estar se perguntando: Se o Hadoop é open-source, porque eu usaria soluções comerciais de Big Data?

Soluções comerciais de Big Data com Hadoop, possuem as seguintes características:

  • Suporte – as principais soluções comerciais do Hadoop oferecem suporte, guias, assistência e melhores práticas.
  • Confiança – sempre que o um bug é detectado, as soluções comerciais prontamente atualizam o software.
  • Pacote completo – as soluções oferecem pacotes completos, com tudo que é necessário para uma infraestrutura de Big Data.

O gráfico abaixo mostra o universo de distribuições comerciais do Hadoop disponíveis. Na sequência, falaremos sobre as principais soluções.

 Soluções Comerciais de Big Data

Cloudera

Cloudera Hadoop ocupa o topo na lista de grande fornecedores de dados Hadoop pois possui uma plataforma confiável para uso comercial desde 2008. Cloudera, fundada por um grupo de engenheiros da Yahoo, Google e Facebook – está focada em fornecer soluções empresariais de Hadoop. Cloudera Hadoop possui cerca de 350 clientes, incluindo o Exército dos EUA, AllState e Monsanto. Alguns deles com implantação de 1000 nós em um cluster Hadoop para análise de dados de cerca de um Petabyte. Cloudera possui um sistema amigável de gestão, chamado Cloudera Manager, para gestão de dados e que possui suporte técnico.

Hortonworks

Hortonworks Data Platform (HDP) é uma suíte de funcionalidades essenciais para implementação do Hadoop, que pode ser usado para qualquer plataforma tecnológica de dados. O principal objetivo da Hortonworks é conduzir todas as suas inovações através da plataforma de dados abertos Hadoop e construir um ecossistema de parceiros que acelera o processo de adoção Hadoop entre empresas. Apache Ambari é um exemplo de console de gerenciamento do cluster Hadoop desenvolvido pelo fornecedor Hortonworks. A Hortonworks tem atraído mais de 60 novos clientes a cada trimestre com algumas contas gigantes como Samsung, Spotify, Bloomberg e eBay. Hortonworks tem atraído também fortes parcerias de engenharia com RedHat, Microsoft, SAP e Teradata.

MapR

MapR Data Plarform suporta mais de 20 projetos open-source. MapR foi reconhecida amplamente por suas distribuições avançadas em Hadoop, no relatório do Gartner “Super Fornecedores em Infraestrutura da Informação e Big Data, 2012”. A Plataforma de Dados MapR visa garantir a implementação do Hadoop em ambiente de produção com uma arquitetura projetada especificamente para aplicações críticas, acesso a dados e integração, além da capacidade para executar o processamento de aplicações analíticas em tempo real.

Pivotal HD

Pivotal HD é uma distribuição comercial do Hadoop. Ele consiste em um conjunto de ferramentas que visam acelerar projetos de análise de dados e expandir as funcionalidades do Hadoop. Possui capacidade de análise em tempo real e decisões de processos de negócio podem ser tomadas quase que imediatamente a análise dos dados.

Amazon Web Services Elastic MapReduce Hadoop

A distribuição Hadoop da Amazon, foi uma das primeiras distribuições do Hadoop. AWS Elastic MapReduce é uma plataforma de análise de dados bem organizada e construída sobre a arquitetura HDFS. Amazon Elastic MapReduce (Amazon EMR) é um web service que facilita o processamento de grandes quantidades de dados, de forma rápida e rentável. Amazon EMR simplifica o processamento de Big Data. Amazon EMR está entre uma das distribuições comerciais do Hadoop com a maior participação no mercado global.

IBM InfoSphere BigInsights Hadoop Distribution

IBM InfoSphere BigInsights é uma distribuição Hadoop da IBM. Com IBM Hadoop usuários podem facilmente configurar e mover dados para clusters Hadoop em não mais de 30 minutos, com taxa de processamento de dados de 60 centavos de dólar por cluster Hadoop, por hora. Com o IBM BigInsights, os clientes podem acelerar seus projetos de Big Data e análise de dados, aproveitando o poder do Hadoop.

Microsoft Hadoop Distribution

A Forrester classifica a distribuição Microsoft Hadoop como grau 4 (em uma escala que vai até 5). A nível de exemplo, Cloudera e Hortonworks estão classificados como grau 5. O Hadoop foi criado com base no Unix, mas a Microsoft tem feito esforços para que o Hadoop execute em máquinas Windows. O Hadoop é oferecido pela Microsoft nas suas soluções de Big Data, através do Windows Azure HDInsight. É possível executar queries Hadoop para buscar dados no SQL Server, banco de dados relacional da Microsoft.

Com os grandes players do mercado voltando suas atenções para o Hadoop e o Big Data, este com certeza é o caminho a se seguir.

David Matos

Relacionado

3 thoughts on “Soluções Comerciais de Big Data”

  1. Pingback: A Ciência de Dados em 2016 - Ciência e DadosCiência e Dados
  2. Grimaldo Oliveira disse:
    12 de maio de 2016 às 9:58 PM

    David conheci seu site hoje, realmente muito legal e interessante, sou o Grimaldo do BI com Vatapá, blog da área, parabéns!

    Responder
    1. David Matos disse:
      12 de maio de 2016 às 10:08 PM

      Olá Grimaldo. Obrigado pelo feedback. Abs. David

      Responder

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Assinar blog por e-mail

Digite seu endereço de e-mail para assinar este blog e receber notificações de novas publicações por e-mail.

Buscar

Tags Mais Comuns nos Posts

Agentes de IA Analytics Análise de Negócios Apache Spark AWS Big Data Blockchain Business Intelligence Cache-Augmented Generation (CAG) ChatGPT Cientista de Dados Cientistas de Dados Ciência de Dados Cloud Computing Data Lake Data Mesh Data Science Data Scientist Data Warehouse Deep Learning Deploy Engenharia de Dados Estatística GPU GraphRAG Hadoop IA Generativa Inteligência Artificial Internet of Things Linguagem Python Linguagem R LLM LLMs Machine Learning Metadados Normalização NVIDIA Oracle Pipeline de Dados Predictive Analytics Probabilidade PySpark Python RAG Storytelling

Histórico de Posts

  • maio 2025 (1)
  • abril 2025 (2)
  • março 2025 (4)
  • fevereiro 2025 (8)
  • janeiro 2025 (5)
  • dezembro 2024 (4)
  • novembro 2024 (1)
  • outubro 2024 (1)
  • setembro 2024 (1)
  • agosto 2024 (1)
  • julho 2024 (3)
  • junho 2024 (1)
  • maio 2024 (1)
  • abril 2024 (2)
  • março 2024 (1)
  • fevereiro 2024 (1)
  • janeiro 2024 (1)
  • dezembro 2023 (1)
  • outubro 2023 (2)
  • setembro 2023 (1)
  • agosto 2023 (4)
  • julho 2023 (2)
  • junho 2023 (4)
  • maio 2023 (2)
  • abril 2023 (2)
  • março 2023 (3)
  • fevereiro 2023 (3)
  • janeiro 2023 (3)
  • dezembro 2022 (7)
  • novembro 2022 (6)
  • outubro 2022 (2)
  • setembro 2022 (3)
  • agosto 2022 (2)
  • julho 2022 (2)
  • junho 2022 (3)
  • maio 2022 (1)
  • abril 2022 (3)
  • março 2022 (1)
  • fevereiro 2022 (3)
  • janeiro 2022 (2)
  • dezembro 2021 (1)
  • novembro 2021 (5)
  • outubro 2021 (2)
  • setembro 2021 (3)
  • agosto 2021 (1)
  • junho 2021 (1)
  • fevereiro 2021 (2)
  • janeiro 2021 (1)
  • dezembro 2020 (1)
  • novembro 2020 (1)
  • outubro 2020 (2)
  • agosto 2020 (1)
  • abril 2020 (1)
  • março 2020 (1)
  • fevereiro 2020 (2)
  • agosto 2019 (1)
  • abril 2019 (1)
  • setembro 2018 (2)
  • julho 2018 (1)
  • junho 2018 (3)
  • abril 2018 (1)
  • março 2018 (1)
  • fevereiro 2018 (2)
  • janeiro 2018 (1)
  • dezembro 2017 (1)
  • novembro 2017 (1)
  • outubro 2017 (1)
  • setembro 2017 (1)
  • julho 2017 (1)
  • junho 2017 (1)
  • maio 2017 (2)
  • abril 2017 (1)
  • janeiro 2017 (1)
  • novembro 2016 (1)
  • outubro 2016 (1)
  • setembro 2016 (1)
  • julho 2016 (1)
  • junho 2016 (1)
  • maio 2016 (1)
  • abril 2016 (1)
  • fevereiro 2016 (1)
  • janeiro 2016 (3)
  • dezembro 2015 (4)
  • novembro 2015 (6)
  • outubro 2015 (9)
  • setembro 2015 (9)
  • agosto 2015 (9)
©2025 Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
 

Carregando comentários...