OneLake, OneDrive for Data
OneLake on yksi, yhdistetty looginen Data Lake -tallennustila koko organisaatiolle. A Data Lake käsittelee suuria tietomääriä eri lähteistä. OneDriven tavoin OneLake tulee automaattisesti kaikkien Microsoft Fabric -vuokraajien mukana, ja se on suunniteltu käytettäväksi kaikissa analytiikkatiedoissasi yhdessä paikassa. OneLake tuo asiakkaat:
- Yksi Data Lake -tallennustila koko organisaatiolle
- Yksi kopio tiedoista käytettäväksi useiden analyysimoottoreiden kanssa
Yksi Data Lake -tallennustila koko organisaatiolle
Ennen OneLakea asiakkaiden oli helpompi luoda useita järviä eri liiketoimintaryhmille sen sijaan, että he olisivat tehneet yhteistyötä yksittäisen järven parissa, vaikka useiden resurssien hallinta lisäisi kuormitusta. OneLake keskittyy näiden haasteiden poistamiseen parantamalla yhteistyötä. Jokaisella asiakasvuokraajalla on täsmälleen yksi OneLake. Kangasta ei voi olla enempää kuin yksi, ja jos sinulla on Fabric, se ei voi koskaan olla nolla. Jokainen Fabric-vuokraaja valmistaa automaattisesti OneLaken ilman lisäresursseja määritettäväksi tai hallittavaksi.
Oletusarvoisesti jaettua omistajuutta yhteistyötä varten
Vuokraajan käsite on SaaS-palvelun ainutlaatuinen etu. Tieto siitä, mistä asiakkaan organisaatio alkaa ja päättyy, tarjoaa luonnollisen hallinnan ja vaatimustenmukaisuuden rajan, joka on vuokraajan järjestelmänvalvojan hallinnassa. Kaikkia OneLakeen tallennettuja tietoja hallitaan oletusarvoisesti. Vaikka kaikki tiedot ovat vuokraajan järjestelmänvalvojan määrittämien rajojen sisällä, on tärkeää, että tästä järjestelmänvalvojasta ei tule keskitettyä portinvartijaa, joka estää muita organisaation osia osallistumasta OneLakeen.
Vuokraajassa voi luoda minkä tahansa määrän työtiloja. Työtilojen avulla organisaation eri osat voivat jakaa omistajuus- ja käyttöoikeuskäytäntöjä. Kukin työtila on osa kapasiteettia, joka on sidottu tiettyyn alueeseen ja laskutetaan erikseen.
Työtilassa voit luoda tietokohteita ja käyttää OneLaken kaikkia tietoja tietokohteiden kautta. Kuten Office tallentaa Word-, Excel- ja PowerPoint-tiedostoja OneDriveen, Fabric tallentaa Lakehouse-tallennustilat, varastot ja muut OneLake-kohteet. Kohteet voivat luoda räätälöityjä kokemuksia kullekin persoonalle, kuten Apache Spark -kehittäjäkokemuksen Lakehousessa.
Lisätietoja OneLaken käytön aloittamisesta on kohdassa Lakehousen luominen OneLaken avulla.
Avaa kaikilla tasoilla
OneLake on avoinna kaikilla tasoilla. OneLake on kehitetty Azure Data Lake Storage (ADLS) Gen2:n pohjalta, ja se voi tukea mitä tahansa tiedostotyyppejä, jäsennettyjä tai rakenteettomia. Kaikki Fabric-tietokohteet, kuten tietovarastot ja lakehouset, tallentavat tietonsa automaattisesti OneLake-muotoon Delta Parquet -muodossa. Jos tietoteknikko lataa tiedot lakehouseen Apache Sparkin avulla ja sitten SQL-kehittäjä lataa T-SQL:n avulla tiedot täysin tapahtumapohjaiseen tietovarastoon, molemmat osallistuvat samaan Data Lake -tallennustilaan. OneLake tallentaa kaikki taulukkomuotoiset tiedot Delta Parquet -muodossa.
OneLake tukee samoja ADLS Gen2 -ohjelmointirajapintoja ja SDK-ohjelmointirajapintoja, jotka ovat yhteensopivia olemassa olevien ADLS Gen2 -sovellusten, kuten Azure Databricksin, kanssa. Voit käsitellä tietoja OneLakessa ikään kuin se olisi yksi suuri ADLS-tallennustili koko organisaatiolle. Jokainen työtila näkyy säilönä kyseisellä tallennustilillä, ja eri tietokohteet näkyvät kansioina kyseisissä säilöissä.
Katso lisätietoja ohjelmointirajapinnoista ja päätepisteistä kohdasta OneLake-käyttöoikeus ja ohjelmointirajapinnat. Esimerkkejä Azuren OneLake-integroinnista on artikkeleissa Azure Synapse Analytics, Azure-tallennustilan hallinta, Azure Databricks ja Azure HDInsight .
OneLake-resurssienhallinta Windowsille
OneLake on OneDrive for Data. OneDriven tavoin voit helposti tutkia OneLake-tietoja Windowsista Käyttämällä Windowsin OneLake-resurssienhallintaa . Voit siirtyä kaikissa työtiloissa ja tietokohteissa, ladata, ladata tai muokata tiedostoja helposti samalla tavalla kuin Officessa. OneLake-tiedostonhallinta yksinkertaistaa Data Lake -tallennustilojen käyttöä, jolloin niitä voi käyttää myös ammattitautetuille yrityskäyttäjille.
Lisätietoja on artikkelissa OneLake-resurssienhallinta.
Yksi tietojen kopio
OneLake pyrkii antamaan sinulle mahdollisimman suuren arvon yksittäisestä tietojen kopiosta ilman tietojen siirtämistä tai monistamista. Sinun ei enää tarvitse kopioida tietoja vain käyttääksesi niitä toisen moduulin kanssa tai hajottaaksesi siiloja, jotta voit analysoida tietoja muista lähteistä peräisin olleilla tiedoilla.
Pikanäppäimet yhdistävät tietoja toimialueiden välillä ilman tietojen siirtoa
Pikakuvakkeiden avulla organisaatiosi voi helposti jakaa tietoja käyttäjien ja sovellusten välillä ilman, että tietoja tarvitsee siirtää ja monistaa tarpeettomasti. Kun tiimit toimivat itsenäisesti erillisissä työtiloissa, pikakuvakkeiden avulla voit yhdistää tietoja eri liiketoimintaryhmistä ja toimialueista virtuaaliseen tietotuotteeseen käyttäjän erityistarpeiden mukaan.
Pikakuvake on viittaus muihin tiedostosijainteihin tallennettuihin tietoihin. Nämä tiedostosijainnit voivat olla samassa työtilassa tai eri työtiloissa, OneLakessa tai OneLaken ulkopuolella ADLS:ssä, S3:ssa tai Dataversessa. Kohdesijainteja on tulossa pian lisää. Sijainnista riippumatta pikakuvakkeiden avulla tiedostot ja kansiot näyttävät siltä, että ne on tallennettu paikallisesti.
Lisätietoja pikakuvakkeiden käyttämisestä on artikkelissa OneLake-pikakuvakkeet.
Yksi tietojen kopio useilla analyyttisillä moottoreilla
Vaikka sovelluksissa saattaa olla tallennustilan ja tietojenkäsittelyn erittely, tiedot on usein optimoitu yhdelle moduulille, mikä vaikeuttaa samojen tietojen uudelleenkäyttöä useissa sovelluksissa. Fabric-funktiolla eri analysointimoottorit (T-SQL, Apache Spark, Analysis Services jne.) tallentavat tiedot avoimeen Delta Parquet -muotoon, jotta voit käyttää samoja tietoja useissa moottoreissa.
Sinun ei enää tarvitse kopioida tietoja vain käyttääksesi niitä toisen moduulin kanssa. Pystyt aina valitsemaan parhaan moottorin sille työlle, jota yrität tehdä. Kuvitellaan esimerkiksi, että sinulla on RYHMÄ SQL-insinöörejä, jotka rakentavat täysin tapahtumakohtaisen tietovaraston. He voivat käyttää T-SQL-moduulia ja T-SQL:n tehoa taulukoiden luomiseen, tietojen muuntamiseen ja tietojen lataamiseen taulukoihin. Jos tietotutkija haluaa hyödyntää näitä tietoja, hänen ei enää tarvitse käydä läpi erityistä Spark/SQL-ohjainta. OneLake tallentaa kaikki tiedot Delta Parquet -muodossa. Tietojenkäsittelyasiantuntijat voivat käyttää Spark-moduulin ja sen avoimen lähdekoodin kirjastojen täyttä tehoa suoraan tietojen kautta.
Yrityskäyttäjät voivat luoda Power BI -raportteja suoraan OneLaken päälle käyttämällä Analysis Services -moduulin uutta Direct Lake -tilaa. Semanttisten Power BI -mallien voimana on Analysis Services -moduuli, joka on aina tarjonnut kaksi tietojen käyttötilaa: tuonnin ja suoran kyselyn. Direct Lake -tila tarjoaa käyttäjille kaiken tuonnin nopeuden ilman tietojen kopioimista, mikä yhdistää parhaan tuonnin ja suoran kyselyn. Lisätietoja on kohdassa Direct Lake.
Esimerkkikaavio, joka näyttää tietojen lataamisen Sparkin avulla, kyselyn T-SQL:n avulla ja tietojen tarkastelemisen Power BI -raportissa.