Os 4 Vs do Big Data são: Volume, Variety, Velocity e Veracity.
- Volume – refere-se ao tamanho dos dados.
- Variety – refere-se ao formato dos dados.
- Velocity – refere-se à velocidade de streaming dos dados.
- Veracity – refere-se sobre os dados serem confiáveis ou não.
Quando se fala de volume, e portanto do tamanho dos dados, para Big Data esperamos que os dados tenham realmente um grande volume. Mas precisamos colocar isso em números para entender melhor:
– Espera-se que 40 zettabytes de dados sejam criados até 2020 no mundo.
– Cerca de 2.5 quintillionbytes de dados são criados por dia.
– Existem atualmente cerca de 6 bilhões de mobile phones no planeta.
– As empresas americanas armazenam cerca de 100 terabytes de dados. Cada uma.
– Em 2009, 966 petabytes de dados foram armazenados pela indústria americana.
Mas tão importante quanto o tamanho, é a variedade e formato dos dados. Por exemplo:
– 150 exabytes é a estimativa de dados que foram gerados especificamente para healthcare em todo o mundo no ano de 2011.
– Mais de 4 bilhões de horas por mês são usadas para assistir vídeos no YouTube.
– 30 bilhões de imagens são publicadas por mês no Facebook.
– 200 milhões de usuários ativos por mês, publicam 400 milhões de tweets por dia.
Se o tamanho dos dados já atingiu números inimagináveis e o formato é dos mais variados, isso deve-se a velocidade com que estes dados são criados. Vamos aos números:
– 1 terabyte de informação de trade é criada durante uma única sessão da bolsa de valores Americana, New York Stock Exchange.
– Aproximadamente 100 sensores estão instalados nos carros modernos para monitorar nível de combustível, pressão dos pneus e muitos outros aspectos do veículo.
– 18.9 billhões de conexões de rede existirão até 2016
Mas a confiança nos dados fará a diferença entre projetos de Big Data bem sucedidos ou não:
Atualmente, 1 em cada 3 gestores tem experimentado problemas relacionados a veracidade dos dados para tomar decisões de negócios. Além disso, estima-se que 3.1 trilhões de dólares por ano sejam desperdiçados na economia americana devido a pobre qualidade dos dados.
Quais são as oportunidades, informações, respostas e tendências armazenadas nestes dados?
Esses são os 4 Vs do Big Data. São muitos os desafios relacionados a volume, variedade, velocidade e veracidade dos dados e para superá-los, muitas novas soluções tem sido criadas. Vamos tratar disso nos próximos posts.
Se quiser entender quão grande é Petabyte, Exabyte, Zettabyte ou Yottabyte, aqui tem uma explicação bem simples: How Big Is A Petabyte, Exabyte, Zettabyte, Or A Yottabyte?
Referências:
- V. Mayer-Schonberger and K. Cukier, Big Data: A revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt, 2013.
- J. R. GalbRaith, Organizational Design Challenges Resulting From Big Data, Journal of Organisation Design, Apr 2014
David Matos
4 thoughts on “Big Data’s 4 Vs”