Post

Schema em Data Lakes e Data Warehouses

Schema em Data Lakes e Data Warehouses

Data Werehouses

Data Werehouses (DW) são sistemas projetados para armazenar dados de forma organizada e estruturada, com o objetivo de apoiar processos de análise e tomada de decisão. Por essa rasão é necessário definir uma estrutura ou schema do DW antes de inserir os dados, ou seja, ele segue um processo chamado schema-on-write. Portanto a modelagem dos dados precisa ser feita antecipadamente, de forma que o DW armazene dados limpos, transformados e organizados.

Data Lakes

Data Lakes (DL) são repositórios de dados que permitem armazenar grandes volumes de dados em seu formato bruto, sem a necessidade de estruturação prévia. Eles utilizam um modelo: schema-on-read, onde a estrutura dos dados é definida somente no momento da leitura ou análise. Portanto os Dls flexíveis para armazenar dados em diversos formatos , seja eles estruturados, semi estruturados, não estruturados.

Data WereHousesData lakes
schema-on-writeschema-on-read
dados estruturadosdados brutos
This post is licensed under CC BY 4.0 by the author.