Big Data’s 4 Vs

Big Data's 4 Vs

Os 4 Vs do Big Data são: Volume, Variety, Velocity e Veracity.

  • Volume – refere-se ao tamanho dos dados.
  • Variety – refere-se ao formato dos dados.
  • Velocity – refere-se à velocidade de streaming dos dados.
  • Veracity – refere-se sobre os dados serem confiáveis ou não.

Quando se fala de volume, e portanto do tamanho dos dados, para Big Data esperamos que os dados tenham realmente um grande volume. Mas precisamos colocar isso em números para entender melhor:

– Espera-se que 40 zettabytes de dados sejam criados até 2020 no mundo.
– Cerca de 2.5 quintillionbytes de dados são criados por dia.
– Existem atualmente cerca de 6 bilhões de mobile phones no planeta.
– As empresas americanas armazenam cerca de 100 terabytes de dados. Cada uma.
– Em 2009, 966 petabytes de dados foram armazenados pela indústria americana.

Mas tão importante quanto o tamanho, é a variedade e formato dos dados. Por exemplo:

– 150 exabytes é a estimativa de dados que foram gerados especificamente para healthcare em todo o mundo no ano de 2011.
– Mais de 4 bilhões de horas por mês são usadas para assistir vídeos no YouTube.
– 30 bilhões de imagens são publicadas por mês no Facebook.
– 200 milhões de usuários ativos por mês, publicam 400 milhões de tweets por dia.

Se o tamanho dos dados já atingiu números inimagináveis e o formato é dos mais variados, isso deve-se a velocidade com que estes dados são criados. Vamos aos números:

– 1 terabyte de informação de trade é criada durante uma única sessão da bolsa de valores Americana, New York Stock Exchange.
– Aproximadamente 100 sensores estão instalados nos carros modernos para monitorar nível de combustível, pressão dos pneus e muitos outros aspectos do veículo.
– 18.9 billhões de conexões de rede existirão até 2016

Mas a confiança nos dados fará a diferença entre projetos de Big Data bem sucedidos ou não:

Atualmente, 1 em cada 3 gestores tem experimentado problemas relacionados a veracidade dos dados para tomar decisões de negócios. Além disso, estima-se que 3.1 trilhões de dólares por ano sejam desperdiçados na economia americana devido a pobre qualidade dos dados.

Quais são as oportunidades, informações, respostas e tendências armazenadas nestes dados?

Esses são os 4 Vs do Big Data. São muitos os desafios relacionados a volume, variedade, velocidade e veracidade dos dados e para superá-los, muitas novas soluções tem sido criadas. Vamos tratar disso nos próximos posts.

Se quiser entender quão grande é Petabyte, Exabyte, Zettabyte ou Yottabyte, aqui tem uma explicação bem simples: How Big Is A Petabyte, Exabyte, Zettabyte, Or A Yottabyte?

Referências:

David Matos

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *