Schema em Data Lakes e Data Warehouses
Data Werehouses
Data Werehouses (DW) são sistemas projetados para armazenar dados de forma organizada e estruturada, com o objetivo de apoiar processos de análise e tomada de decisão. Por essa rasão é necessário definir uma estrutura ou schema do DW antes de inserir os dados, ou seja, ele segue um processo chamado schema-on-write. Portanto a modelagem dos dados precisa ser feita antecipadamente, de forma que o DW armazene dados limpos, transformados e organizados.
Data Lakes
Data Lakes (DL) são repositórios de dados que permitem armazenar grandes volumes de dados em seu formato bruto, sem a necessidade de estruturação prévia. Eles utilizam um modelo: schema-on-read, onde a estrutura dos dados é definida somente no momento da leitura ou análise. Portanto os Dls flexíveis para armazenar dados em diversos formatos , seja eles estruturados, semi estruturados, não estruturados.
Data WereHouses | Data lakes |
---|---|
schema-on-write | schema-on-read |
dados estruturados | dados brutos |