Tem havido ultimamente, muita discussão sobre linguagens de programação utilizadas em Data Science. Python e R são as mais populares entre os Cientistas de Dados, enquanto o Java tem sido a linguagem usada para aplicativos e desenvolvimento sobre Hadoop.
O Cientista de Dados no Mercado Financeiro
Recentemente o JPMorgan Chase, um dos 5 maiores bancos do planeta, anunciou que estava contratado Cientistas de Dados. Entre os requerimentos, estava o desenvolvimento de modelos de detecção de padrões em comunicação eletrônica.
Big Data como Serviço
O mundo da tecnologia anda em uma velocidade cada vez maior. Isso é fato. E quanto mais conhecimento é gerado, mais soluções que nunca haviam sido pensadas (talvez porque os problemas se quer existiam), vão sendo criadas. E com a Ciência de Dados não tem sido diferente.
O Papel da Estatística na Ciência de Dados
A American Statistical Association (ASA) divulgou semana passada uma declaração sobre o papel da Estatística na Ciência de Dados. O Presidente da ASA, David Morganstein, deu esta declaração no seu comunicado de imprensa:
Cientista de Dados na Análise de Crimes
Nos últimos anos, a Ciência de Dados tem sido cada vez incorporada a metodologias de combate ao crime, em uma prática que está seno chamada de policiamento preditivo.
Apache Spark e Data Science
A análise de dados tem crescido a cada dia e várias ferramentas tem surgido para auxiliar aqueles que trabalham com dados. Uma destas ferramentas é o Apache Spark.
Usando Python em Data Science
Se você estiver pensando em aprender Python como sua linguagem de programação para Data Science, uma pergunta pode ajudar neste processo: “Quais são as diferentes bibliotecas Python disponíveis para realizar a análise de dados?”
A Arte da Ciência de Dados
Ciência de Dados é uma mistura de arte com engenharia. Reconhecer padrões nos dados, considerar que questionamentos devem ser feitos e determinar o melhor algoritmo para extrair a informação, seria o lado “arte” da Ciência de Dados.
Chief Data Officer
Embora o volume de dados aumente a cada dia, o que requer investimento em armazenamento e análise, a má gestão dos dados ainda tem sido o que mais se vê no ambiente corporativo. Gerenciar dados custa caro e de acordo com o Gartner, estima-se um prejuízo na ordem de 13 bilhões de dólares com o gerenciamento ineficaz dos dados.
Análise de Sentimentos e Machine Learning
A ascensão das mídias sociais, como blogs e redes sociais tem despertado interesse em análise de sentimento. Com a proliferação de opiniões, avaliações, recomendações e outras formas de expressão on-line, a opinião se transformou em uma espécie de moeda virtual para empresas que desejam comercializar os seus produtos, identificar novas oportunidades e gerenciar suas reputações.