Introdução

Concluído

Muitas organizações passaram as últimas duas décadas criando data warehouses e soluções de BI (business intelligence) com base em sistemas de banco de dados relacional. Muitas soluções de BI perderam oportunidades de armazenar dados não estruturados devido ao custo e à complexidade desses tipos de dados em bancos de dados.

Os data lakes tornaram-se uma solução comum para esse problema. Um data lake fornece armazenamento baseado em arquivo, geralmente em um sistema de arquivos distribuído que dá suporte à alta escalabilidade para grandes volumes de dados. As organizações podem armazenar arquivos estruturados, semiestruturados e não estruturados no data lake e, em seguida, consumi-los de lá em tecnologias de processamento de Big Data, como o Apache Spark.

O Azure Data Lake Storage Gen2 fornece uma solução baseada em nuvem para o armazenamento de data lake no Microsoft Azure e sustenta muitas soluções de análise em larga escala criadas no Azure.