Mitä on tietovarastointi Microsoft Fabricissa?
Koskee:✅ SQL-analytiikan päätepiste ja Microsoft Fabric -varasto
Microsoft Fabric on uuden sukupolven tietovarastoratkaisu Microsoft Fabricissa.
Järvikeskeinen varasto perustuu yritysluokan hajautettuun prosessointimoduuliin, joka mahdollistaa alan johtavan suorituskyvyn mittakaavassa ja minimoi konfigurointi- ja hallintatarpeen. Fabric-tietovarastossa asuminen Data Lake -järjestelmässä ja suunniteltu tukemaan suoraan avoimia tietomuotoja, mahdollistaa saumattoman yhteistyön datainsinöörien ja yrityskäyttäjien välillä suojausta tai hallintoa vaarantamatta.
Helppokäyttöinen SaaS-käyttökokemus on myös integroitu tiukasti Power BI:hin, mikä helpottaa analysointia ja raportointia, lähentämällä Data Lake -tallennustilojen ja varastojen maailmaa ja yksinkertaistamalla huomattavasti organisaatioiden investointeja analytiikkatiloihinsa.
Tietovaraston asiakkaat hyötyvät:
- Delta-parquet-muotoon tallennetut tiedot mahdollistavat ACID-tapahtumat ja yhteentoimivuuden muiden Fabric-kuormitusten kanssa, joten et tarvitse useita kopioita tiedoista.
- Tietokantakyselyt voivat käyttää useita tietolähteitä nopeisiin merkityksellisiin tietoihin ilman tietojen monistamista.
- Tietojen helppo käyttö, lataaminen ja muuntaminen mittakaavassa putkien, tietovoiden, tietokantakyselyn tai COPY INTO -komennon kautta.
- Autonominen kuormituksen hallinta alan johtavalla hajautetun kyselyn käsittelyohjelmalla ei tarkoita, että suorituskyky kääntyisi parhaan luokan suorituskyvyn saavuttamiseksi.
- Skaalaa lähes välittömästi liiketoiminnan vaatimusten täyttämiseksi. Tallennustila ja käsittely erotetaan toisistaan.
- Vähemmän aikaa merkityksellisille tiedoille helposti käytettävällä, aina yhdistetyllä semanttisella mallilla, joka on integroitu Power BI:n kanssa Direct Lake -tilassa. Raporteissa on aina uusimmat tiedot analysointia ja raportointia varten.
- Rakennettu mille tahansa osaamistasolle, kansalaiskehittäjältä DBA:lle tai data-insinöörille.
Tietovarastointikohteet
Fabric Warehouse ei ole perinteinen yrityksen tietovarasto, se on Lake-varasto, joka tukee kahta erillistä varastointikohdetta: Fabric-tietovarastoa ja SQL-analytiikan päätepistettä. Molempien tarkoitus on täyttää asiakkaiden liiketoimintatarpeet ja tarjota samalla paras luokan suorituskyky, minimoida kustannukset ja vähentää järjestelmänvalvojan kuluja.
Synapse Data Warehouse
Microsoft Fabric -työtilassa Synapse Data Warehouse- tai Warehouse-kohteen Tyyppi-sarakkeessa on "Varasto". Tämä on nopea ja yksinkertainen ratkaisu, kun tarvitset tietovaraston täydet teho- ja tapahtumatoiminnot (DDL- ja DML-kyselyjen tuki).
Varasto voidaan täyttää millä tahansa tuetulla tietojen käsittelymenetelmällä, kuten KOPIOI SISÄÄN-, Putket-, Tietovuot- tai Tietokannan ristiinkäsittely -vaihtoehdoilla, kuten LUO TAULUKKO MUODOSSA SELECT (CTAS) ja LISÄÄ. VALITSE tai VALITSE SISÄÄN.
Voit aloittaa varaston käytön seuraavasti:
Lakehousen SQL-analytiikan päätepiste
Microsoft Fabric -työtilassa kukin Lakehouse sisältää automaattisesti luodun SQL-analytiikan päätepisteen, jonka avulla voidaan siirtyä Lakehousen Lake-näkymästä (joka tukee tietotekniikkaa ja Apache Sparkiä) saman Lakehousen SQL-näkymään näkymien luomiseksi, näkymien, funktioiden, tallennettujen toimintosarjojen luomiseksi ja SQL-suojauksen soveltamiseksi.
Lakehousen SQL-analytiikan päätepisteen avulla T-SQL-komennot voivat määrittää ja kysellä tietoobjekteja, mutta eivät käsitellä tai muokata tietoja. Voit suorittaa seuraavat toimet SQL-analytiikan päätepisteessä:
- Tee kysely taulukoista, jotka viittaavat Lake-järjestelmässä olevien Delta Lake -kansioiden tietoihin.
- Voit luoda näkymiä, tekstiin sidotut TVF-tiedostoja ja toimintatapoja semantiikan ja liiketoimintalogiikan tiivistämiseksi T-SQL:ään.
- Hallitse objektien käyttöoikeuksia.
Jos haluat aloittaa SQL-analytiikan päätepisteen käytön, katso:
- Paremmat yhdessä: Lakehouse ja varasto Microsoft Fabricissa
- SQL-analytiikan päätepisteiden suorituskykyyn liittyvät seikat
- Kysely SQL-analytiikan päätepisteeseen tai Warehouseen Microsoft Fabricissa
Varasto tai lakehouse
Kun päätät käyttää varastoa tai lakehouse-tallennustilan käyttöä, on tärkeää huomioida tietojen hallinta- ja analytiikkavaatimusten erityistarpeet ja konteksti. Yhtä tärkeää on, että tämä ei ole yksisuuntainen päätös!
Sinulla on aina mahdollisuus lisätä toinen tai toinen myöhempänä ajankohtana, jos yrityksesi tarvitsee muutosta. Riippumatta siitä, mistä aloitat, sekä varasto että Lakehouse käyttävät samaa tehokasta SQL-moduulia kaikissa T-SQL-kyselyissä.
Seuraavassa on yleisiä ohjeita, joiden avulla voit tehdä päätöksen:
Valitse tietovarasto, kun tarvitset yritystason ratkaisun, jossa on avoin vakiomuoto, ei suorituskykyilmaisimien suorituskykyä ja minimaalinen määritys. Tietovarasto sopii parhaiten puolirakenteisiin ja jäsenneltyihin tietomuotoihin, ja se sopii sekä aloittelijoille että kokeneille tietoammattijoille ja tarjoaa yksinkertaisen ja intuitiivisen kokemuksen.
Valitse lakehouse, kun tarvitset suuren säilön, jossa on hyvin jäsentämättömiä tietoja heterogeenisista lähteistä, hyödynnät edullista objektisäilöä ja haluat käyttää SPARK-toimintoa ensisijaisena kehitystyökaluna. Koska toimit "kevyenä" tietovarastona, voit aina käyttää SQL-päätepistettä ja T-SQL-työkaluja raportointi- ja tietotietoskenaarioiden tarjoamiseksi Lakehousessasi.
Tarkempia päätöksenteko-ohjeita on Microsoft Fabric -päätösoppaassa: Valinta Warehousen ja Lakehousen välillä.