Introduktion

Slutförd

Många organisationer har ägnat de två senaste årtiondena åt att bygga informationslager och Business Intelligence-lösningar (BI) som baseras på relationsdatabassystem. Många BI-lösningar har förlorat sina möjligheter att lagra ostrukturerade data på grund av kostnader och komplexitet i dessa typer av data i databaser.

Datasjöar har blivit en vanlig lösning på det här problemet. En datasjö tillhandahåller filbaserad lagring, vanligtvis i ett distribuerat filsystem som stöder hög skalbarhet för stora mängder data. Organisationer kan lagra strukturerade, halvstrukturerade och ostrukturerade filer i datasjön och sedan använda dem därifrån i stordatabearbetningstekniker, till exempel Apache Spark.

Azure Data Lake Storage Gen2 tillhandahåller en molnbaserad lösning för datasjölagring i Microsoft Azure och ligger till grund för många storskaliga analyslösningar som bygger på Azure.