Podemos definir a linhagem de dados como o ciclo de vida dos dados ou a jornada dos dados. Esse ciclo de vida inclui onde os dados se originam, como foram obtidos ponto a ponto e, claro, onde estão hoje.
Autor: David Matos
Pipelines de Dados com Apache Hop
O Apache Hop permite projetar visualmente pipelines de dados e workflows. Programação é uma opção, não uma necessidade.
6 Bibliotecas Python Para Processamento de Texto
Essas 6 bibliotecas Python podem ser bastante úteis no processamento de texto. Experimente-as em seus projetos de Ciência de Dados.
Data Mesh x Data Lake x Data Fabric
Vamos comparar e compreender a relação entre Data Mesh, Data Lake e Data Fabric.
Benefícios do Data Mesh
Aqui estão os principais benefícios do Data Mesh.
O Que é Data Mesh?
Data Mesh é uma nova abordagem baseada em uma arquitetura moderna e distribuída para gerenciamento de dados analíticos. Neste post vamos compreender o que é o Data Mesh.
3 Pacotes Python para Análise Interativa de Dados
Este artigo lista 3 Pacotes Python para Análise Interativa de Dados. Clique no nome de cada pacote para acessar a documentação oficial.
5 Melhores Pacotes da Linguagem R Para Cientistas de Dados
No site oficial do CRAN você encontra a lista de todas as bibliotecas disponíveis atualmente para Linguagem R e neste post veremos os 5 Melhores Pacotes da Linguagem R Para Cientistas de Dados.
O Que é Data Economy e Como o Canadá Está Crescendo Sua Economia Baseada em Dados
A economia baseada em dados (Data Economy) está crescendo. Em 2021, a IDC estimou o valor da Data Economy nos EUA em US$ 255 bilhões e na União Europeia em US$ 110 bilhões. Nessas e em muitas outras regiões, o crescimento da Data Economy supera o PIB. A IBM examinou o potencial específico do Canadá para liderança de dados, com lições para qualquer outro país que pretenda competir na Data Economy.
Top 8 Operações SQL Para Manipulação de Dados
A Linguagem SQL é usada ativamente por Analistas de Dados e Cientistas de Dados para tarefas de extração de dados e manipulação de dados. Neste artigo você encontra as Top 8 Operações SQL Para Manipulação de Dados.