O PySpark pode ser um grande consumidor de recursos, principalmente quando você está trabalhando com grandes conjuntos de dados. Ajustar as configurações pode ajudar a otimizar o uso de memória e melhorar o desempenho.
Categoria: Analytics
6 Bibliotecas Python Para Processamento de Texto
Essas 6 bibliotecas Python podem ser bastante úteis no processamento de texto. Experimente-as em seus projetos de Ciência de Dados.
3 Pacotes Python para Análise Interativa de Dados
Este artigo lista 3 Pacotes Python para Análise Interativa de Dados. Clique no nome de cada pacote para acessar a documentação oficial.
O Que é Data Economy e Como o Canadá Está Crescendo Sua Economia Baseada em Dados
A economia baseada em dados (Data Economy) está crescendo. Em 2021, a IDC estimou o valor da Data Economy nos EUA em US$ 255 bilhões e na União Europeia em US$ 110 bilhões. Nessas e em muitas outras regiões, o crescimento da Data Economy supera o PIB. A IBM examinou o potencial específico do Canadá para liderança de dados, com lições para qualquer outro país que pretenda competir na Data Economy.
As 10 Habilidades Mais Procuradas no Universo da Ciência de Dados
Aqui estão 10 habilidades em demanda no universo da Ciência de Dados que ajudarão você a encontrar sua vaga no mercado de trabalho.
Dispositivos Móveis São o Maior Mercado Para Visão Computacional
Inteligência Artificial e Aprendizado de Máquina estão cada vez mais se tornando parte da vida cotidiana e impactando ainda mais como usamos nossos dispositivos. Estamos entrando em uma era em que os dispositivos podem ver, em vez de simplesmente responder ao toque.
Oracle R Enterprise
A Oracle adotou a linguagem R como padrão para apoiar Cientistas de Dados, Analistas de Dados e Estatísticos, na realização de análises avançadas de dados, bem como a geração de gráficos sofisticados, utilizando tecnologias de banco de dados Oracle.
IBM Watson Analytics
A IBM recentemente redesenhou o IBM Watson Analytics, um serviço em nuvem da IBM para computação cognitiva e análise preditiva. Agora, qualquer cidadão pode fazer o upload dos seus dados e descobrir os insights neles contidos.
Apache Kafka e Big Data
Não faz mais sentido falar apenas em dados armazenados em tabelas, com linhas e colunas. O volume de dados agora é tão grande, que os dados precisam ser vistos como o que realmente são: um fluxo constante, que precisa ser analisado em tempo real.
Predictive Analytics
Predictive Analytics (Análise Preditiva) é a prática de extrair informações de conjuntos de dados, a fim de determinar padrões e resultados futuros. Perceba que não existe mágica: o Predictive Analytics não prevê o que vai acontecer exatamente no futuro. Ele prevê o que pode acontecer no futuro com um nível aceitável de confiabilidade e inclui…