Como experimentar rapidamente um pipeline de dados e um grupo de conectores de forma simples e robusta? É aqui que entram ferramentas como o Airbyte.
Autor: David Matos
Os 7 Passos Para Construir Modelos de Machine Learning
Aqui estão os 7 passos principais para construir modelos de Machine Learning, com o percentual em relação ao total, de cada um dos passos.
Kubernetes: Pods, Nodes, Containers e Clusters
O Kubernetes surgiu como plataforma de orquestração de containers, sendo ferramenta essencial para equipes de Engenharia de Dados. Sua importância é cada vez maior na infraestrutura de Big Data e no deploy de modelos de Machine Learning. Vamos compreender o que é o Kubernetes.
DaaP – Data as a Product
Vamos discutir alguns dos principais desafios atuais e como Data as a Product pode ser uma alternativa para aumentar o uso da análise de dados nas empresas.
O Que é Linhagem de Dados (Data Lineage)?
Podemos definir a linhagem de dados como o ciclo de vida dos dados ou a jornada dos dados. Esse ciclo de vida inclui onde os dados se originam, como foram obtidos ponto a ponto e, claro, onde estão hoje.
Pipelines de Dados com Apache Hop
O Apache Hop permite projetar visualmente pipelines de dados e workflows. Programação é uma opção, não uma necessidade.
6 Bibliotecas Python Para Processamento de Texto
Essas 6 bibliotecas Python podem ser bastante úteis no processamento de texto. Experimente-as em seus projetos de Ciência de Dados.
Data Mesh x Data Lake x Data Fabric
Vamos comparar e compreender a relação entre Data Mesh, Data Lake e Data Fabric.
Benefícios do Data Mesh
Aqui estão os principais benefícios do Data Mesh.
O Que é Data Mesh?
Data Mesh é uma nova abordagem baseada em uma arquitetura moderna e distribuída para gerenciamento de dados analíticos. Neste post vamos compreender o que é o Data Mesh.