Huomautus
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Microsoft Fabric Lakehouse on tietojen arkkitehtuuriympäristö, jolla voidaan tallentaa, hallita ja analysoida jäsennettyjä ja jäsentämättömiä tietoja yhdessä sijainnissa. Delta Lake valitaan yhtenäiseksi taulukkomuodoksi, jotta tietoihin saadaan saumaton pääsy kaikissa Microsoft Fabricin käsittelymoottoreissa.
Kun tallennat tietoja Lakehouse-järjestelmään käyttämällä ominaisuuksia, kuten Lataa taulukkoon , tai menetelmiä, jotka on kuvattu kohdassa Asetukset tietojen saamiseksi Fabric Lakehouseen, kaikki tiedot tallennetaan Delta-muodossa.
Jos haluat kattavamman esittelyn Delta Lake -taulukkomuodosta, noudata tämän artikkelin lopussa olevia Aiheeseen liittyvä sisältö -linkkejä.
Massadata, Apache Spark ja vanhat taulukkomuodot
Microsoft Fabric Runtime for Apache Spark käyttää samaa perustaa kuin Azure Synapse Analytics Runtime for Apache Spark, mutta se sisältää tärkeitä eroja, jotka tehostavat kaikkien Microsoft Fabric -palvelun moottoreiden toimintaa. Microsoft Fabricissa suorituskykyominaisuudet ovat oletusarvoisesti käytössä. Kehittyneet Apache Spark -käyttäjät voivat palauttaa määrityksiä aiempiin arvoihin vastaamaan paremmin tiettyjä skenaarioita.
Microsoft Fabric Lakehouse ja Apache Spark -moottori tukevat kaikkia taulukkotyyppejä, sekä hallittuja että hallitsemattomia; Tämä sisältää näkymät ja tavalliset muut kuin Delta Hive -taulukkomuodot. Taulukot, jotka on määritetty käyttämällä PARQUET-, CSV-, AVRO-, JSON- ja mitä tahansa Apache Hive -yhteensopivaa tiedostomuotoa, toimivat odotetulla tavalla.
Lakehouse Explorerin käyttöliittymän käyttökokemus vaihtelee taulukkotyypin mukaan. Tällä hetkellä Lakehousen tutkimuslaitos hahmontaa vain taulukko-objektit.
määrityserot Azure Synapse Analyticsin avulla
Seuraavassa taulukossa on Azure Synapse Analyticsin ja Microsoft Fabric Runtime for Apache Sparkin määrityserot.
Apache Spark -määritys | Microsoft Fabric -arvo | Azure Synapse Analytics -arvo | Muistiinpanot |
---|---|---|---|
spark.sql.sources.default | delta | parketti | Oletustaulukkomuoto |
spark.sql.parquet.vorder.default | tosi | – | V-Order-kirjoittaja |
spark.sql.parquet.vorder.dictionaryPageSize | 2 Gt | – | Sanaston sivun kokorajoitus V-järjestykselle |
spark.databricks.delta.optimizeWrite.enabled | tosi | unset (false) | Optimoi kirjoitus |
Taulukoiden automaattinen etsiminen
Lakehouse Explorer tarjoaa puumaisen näkymän Microsoft Fabric Lakehouse -kohteen objekteihin. Sillä on tärkeä ominaisuus löytää ja näyttää metatietosäilössä ja OneLake-tallennustilassa kuvattuja taulukoita. Taulukkoviittaukset näkyvät Tables
Lakehouse Explorerin käyttöliittymän -osassa. Automaattinen etsintä koskee myös taulukoita, jotka on määritetty OneLake-pikakuvakkeiden avulla.
Taulukot pikakuvakkeiden päällä
Microsoft Fabric Lakehouse tukee OneLake-pikakuvakkeille määritettyjä taulukoita, jotka tarjoavat äärimmäisen yhteensopivuuden, eikä tietojen siirtämistä. Seuraavassa taulukossa on skenaarion parhaat käytännöt kullekin kohdetyypille, kun sitä käytetään pikakuvakkeiden kautta.
Pikakuvakkeen kohde | Pikakuvakkeen luontipaikka | Parhaat käytännöt |
---|---|---|
Delta Lake -taulukko |
Tables osa |
Jos kohdesijainnissa on useita taulukoita, luo yksi pikakuvake taulukkoa kohti. |
Tiedostoja sisältäviä kansioita |
Files osa |
Käytä Apache Sparkiä, jos haluat käyttää kohdetta suoraan suhteellisia polkuja käyttämällä. Lataa tiedot Lakehousen alkuperäisiin Delta-taulukoihin suorituskyvyn parantamiseksi. |
Vanhat Apache Hive -taulukot |
Files osa |
Käytä Apache Sparkiä, jos haluat käyttää kohdetta suoraan suhteellisia polkuja käyttämällä tai luoda metatietoluetteloviittauksen syntaksin avulla CREATE EXTERNAL TABLE . Lataa tiedot Lakehousen alkuperäisiin Delta-taulukoihin suorituskyvyn parantamiseksi. |
Lataa taulukkoon
Microsoft Fabric Lakehouse tarjoaa kätevän ja tuottavan käyttöliittymän, jonka avulla voit tehostaa tietojen lataamista Delta-taulukoihin. Lataa taulukkoon -ominaisuus mahdollistaa visuaalisen käyttökokemuksen yleisten tiedostomuotojen lataamisessa Delta-muotoon, mikä tehostaa analyyttista tuottavuutta kaikille persoonaille. Saat lisätietoja Lataa taulukkoon -toiminnosta lukemalla Lataa Delta Lake -taulukoihin -ohjeartikkelin.
Delta Lake -taulukon optimointi
Taulukoiden pitäminen kunnossa analytiikkaskenaarioiden laajaa käyttöaluetta varten ei ole vähäinen saavutus. Microsoft Fabric Lakehouse mahdollistaa ennakoivasti tärkeät parametrit, jotta voidaan minimoida massadatataulukoihin liittyvät yleiset ongelmat, kuten tiivistys ja pienet tiedostokoot, ja maksimoida kyselyjen suorituskyky. On kuitenkin monia tilanteita, joissa nämä parametrit tarvitsevat muutoksia. Delta Lake - taulukon optimointi ja V-Order-artikkeli kattaa joitakin keskeisiä skenaarioita ja tarjoaa perusteellisemman oppaan siihen, miten voit ylläpitää tehokkaasti Delta-taulukoita suorituskyvyn parantamiseksi.