Introduzione

Completato

Sono vent'anni che molte organizzazioni creano data warehouse e soluzioni di business intelligence (BI) basati su sistemi di database relazionali. Molte soluzioni di BI hanno perso l'opportunità di archiviare dati non strutturati a causa del costo e della complessità di questi tipi di dati e di database.

I data lake sono diventati una soluzione comune a questo problema. Un data lake fornisce l'archiviazione basata su file, in genere in un file system distribuito che supporta una scalabilità elevata per volumi elevati di dati. Le organizzazioni possono archiviare file strutturati, semistrutturati e non strutturati nel data lake e quindi usarli da lì nelle tecnologie di elaborazione dei Big Data, ad esempio Apache Spark.

Azure Data Lake Storage Gen2 offre una soluzione basata sul cloud per Data Lake Storage in Microsoft Azure e supporta molte soluzioni di analisi su larga scala basate su Azure.