Mitä on tietovarastointi Microsoft Fabricissa?
Koskee: SQL-analytiikan päätepiste ja Microsoft Fabric -varasto
Microsoft Fabric tarjoaa asiakkaille yhtenäisen tuotteen, joka käsittelee tietoalueen kaikkia osa-alueita. Se tarjoaa kattavan SaaS-sertifioituja tietoja, analytiikka- ja tekoälyympäristöjä, jotka ovat järvikeskeisiä ja avoimia. Microsoft Fabricin perusteet mahdollistavat aloittelevan käyttäjän ja kokeneen ammattilaisen tietokantojen, analytiikan, viestien, tietojen integroinnin ja liiketoimintatiedon hallinnan kuormituksia monipuolisen, helppokäyttöisen ja jaetun SaaS-kokemuksen kautta Microsoft OneLaken kanssa.
Järvikeskeinen SaaS-kokemus, joka on rakennettu mille tahansa taitotasolle
Microsoft Fabric esittelee yritystason hajautettuun prosessointimoduuliin perustuvan järvikeskeisen tietovaraston, joka mahdollistaa alan johtavan suorituskyvyn mittakaavassa poistaen samalla määritys- ja hallintatarpeen. Helppokäyttöisen SaaS-käyttökokemuksen ansiosta, joka on tiiviisti integroitu Power BI:hin helppoa analysointia ja raportointia varten, Microsoft Fabricin Varastot yhtyvät datajärvien ja varastojen maailmaan, joten se yksinkertaistaa huomattavasti organisaatioiden investointeja analytiikkatiloihinsa. Tietojen varastointikuormitukset hyötyvät SQL-moduulin monipuolisista ominaisuuksista avoimen tietomuodon ansiosta, jolloin asiakkaat voivat keskittyä tietojen valmisteluun, analysointiin ja raportointiin yhdessä Kopiossa Microsoft OneLakeen tallennetuista tiedoista.
Varasto on rakennettu mille tahansa osaamistasolle – kansalaiskehittäjästä ammattikehittäjään, DBA:han tai tietoteknikkoon. Microsoft Fabric -työtilaan rakennettujen monipuolisien kokemusten ansiosta asiakkaat voivat lyhentää merkityksellisten tietojen käyttöaikaa käyttävällä ja aina yhdistetyllä semanttisella mallilla, joka on integroitu Power BI:n kanssa DirectLake-tilassa. Tämä mahdollistaa alan tärkeimmän suorituskyvyn, joka varmistaa, että asiakkaan raportissa on aina uusimmat tiedot analysointia ja raportointia varten. Tietokantojen välistä kyselyä voidaan hyödyntää nopeassa ja saumattomassa käytössä useissa tietolähteissä nopeita merkityksellisiä tietoja varten ja tietojen päällekkäisyyttä varten.
Näennäisvarastot, joissa on tietokantojen välillä kyselyjä
Microsoft Fabric tarjoaa asiakkaille mahdollisuuden seisoa virtuaalivarastoissa, jotka sisältävät tietoja käytännöllisesti katsoen mistä tahansa lähteestä, pikakuvakkeiden avulla. Asiakkaat voivat luoda virtuaalivaraston luomalla pikakuvakkeita tietoihinsa, jotka sijaitsevat siellä. Näennäisvarasto voi koostua OneLaken, Azure Data Lake Storagen tai minkä tahansa muun pilvipalvelutoimittajan tallennustilasta yhdessä reunassa ilman tietojen monistamista.
Voit avata arvoa saumattomasti useista eri tietolähteistä Microsoft Fabricin tietokantakyselyiden runsauden kautta. Tietokantojen välisen kyselyn avulla asiakkaat voivat nopeasti ja saumattomasti käyttää useita tietolähteitä nopeisiin merkityksellisiin tietoihin ilman tietojen päällekkäisyyttä. Eri lähteisiin tallennetut tiedot voidaan helposti liittää yhteen, jolloin asiakkaat voivat tarjota monipuolisia merkityksellisiä tietoja, jotka aiemmin edellyttivät merkittävää vaivaa tietojen integrointi- ja suunnittelutiimeiltä.
Tietokantakyselyitä voidaan luoda Visual Query -editorin kautta . Visual Query -editori tarjoaa koodittomuuspolun useiden taulukoiden merkityksellisiin tietoihin. SQL-kyselyeditoria tai muita tuttuja työkaluja, kuten SQL Server Management Studiota (SSMS), voidaan käyttää myös tietokantakyselyjen luomiseen.
Itsenäinen kuormituksen hallinta
Microsoft Fabricin varastot hyödyntävät alan johtavaa hajautettua kyselyjen käsittelymoduulia, joka tarjoaa asiakkaille kuormituksia, joilla on luonnollinen eristys -raja. Ei ole nuppineuloja, jotka kääntyvät autonomisen jakamisen ja resurssien poistamisen kanssa tarjotakseen parhaan rotujen suorituskyvyn automaattisen mittakaavan ja samanaikaisuuden avulla. Todellinen eristys saavutetaan erottamalla kuormitukset eri ominaisuuksista ja varmistamalla, että ETL-työt eivät koskaan häiritse niiden ad-hoc-analytiikkaa ja raportointikuormituksia.
Saumattoman moottorin yhteentoimivuuden avoin muoto
Varaston tiedot tallennetaan parquet-tiedostomuotoon ja julkaistaan nimellä Delta Lake Logs, mikä mahdollistaa ACID-tapahtumat ja moduulien välisen yhteentoimivuuden, jota voidaan hyödyntää muiden Microsoft Fabric -kuormitusten, kuten Spark-, Pipelines-, Power BI- ja Azure Data Explorer -kuormitusten kautta. Asiakkaiden ei enää tarvitse luoda tiedoistaan useita kopioita, jotta tietoalan ammattilaiset, joilla on erilaiset taitojoukot, voivat luoda niistä useita kopioita. Pythonissa työskentelyun tottuneet tietoteknikot voivat helposti käyttää samoja tietoja, jotka mallinsi ja palveli tietovarastoammattilainen, joka on tottunut työskentelemään SQL:ssä. Rinnakkainen bi-ammattilaiset voivat nopeasti ja helposti käyttää samoja tietoja luodakseen Power BI:hin monipuolisia visualisointeja, joiden suorituskyky on tietueiden päällekkäinen ja joilla ei ole päällekkäistä tietoa.
Tallennustilan erittely ja käsittely
Käsittely ja tallennus erotetaan varastosta, jolloin asiakkaat voivat skaalata nopeasti liiketoiminnan tarpeisiin. Näin useat käsittelymoduulit voivat lukea mistä tahansa tuetuista tallennuslähteistä luotettavilla tietoturvatakuilla ja kokonaisilla HAPPO-tapahtumatakuilla.
Käytä helposti, lataa ja muunna mittakaavassa
Tietoja voidaan käsitellä varastoon putkien, tietovoiden, tietokantakyselyn tai COPY INTO -komennon kautta. Kun tiedot on otettu käyttöön, useat liiketoimintaryhmät voivat analysoida tietoja toimintojen, kuten jakamisen ja tietokantakyselyjen välillä, avulla. Aikaa merkityksellisiin tietoihin nopeuttaa täysin integroidun BI-kokemuksen kautta graafisen tietojen mallinnuksen kautta, joka on helppokäyttöinen verkkokokemus kyselyihin Warehouse Editorissa.
Tietovarastointikohteet Microsoft Fabricissa
Tietovarastossa on kaksi erillistä kohdetta: Lakehousen ja Warehousen SQL-analytiikan päätepiste.
Lakehousen SQL-analytiikan päätepiste
SQL-analytiikan päätepiste on varasto, joka luodaan automaattisesti Microsoft Fabricin Lakehousesta . Asiakas voi siirtyä Lakehouse-näkymästä (joka tukee tietotekniikkaa ja Apache Sparkia) SAMAN Lakehousen SQL-näkymään. SQL-analytiikan päätepiste on vain luku -tilassa. Tietoja voi muokata vain Lakehouse-näkymän kautta Sparkin avulla.
Lakehousen SQL-analytiikan päätepisteen kautta käyttäjällä on SQL-komentojen alijoukko, joka voi määrittää ja kysellä tietoobjekteja mutta ei käsitellä tietoja. Voit suorittaa seuraavat toimet SQL-analytiikan päätepisteessä:
- Tee kysely taulukoista, jotka viittaavat Lake-järjestelmässä olevien Delta Lake -kansioiden tietoihin.
- Voit luoda näkymiä, tekstiin sidotut TVF-tiedostoja ja toimintatapoja semantiikan ja liiketoimintalogiikan tiivistämiseksi T-SQL:ään.
- Hallitse objektien käyttöoikeuksia.
Microsoft Fabric -työtilassa SQL-analytiikan päätepiste on merkitty Tyyppi-sarakkeen "SQL-analytiikan päätepisteeksi". Each Lakehousessa on automaattisesti luotu SQL-analytiikan päätepiste, jota voidaan hyödyntää tutuilla SQL-työkaluilla, kuten SQL Server Management Studiolla, Azure Data Studiolla, Microsoft Fabric SQL -Päringuredaktor.
Jos haluat aloittaa SQL-analytiikan päätepisteen käytön, tutustu kohtaan Paremmat yhdessä: Lakehouse ja Microsoft Fabric -varasto.
Synapse Data Warehouse
Microsoft Fabric -työtilassa Synapse Data Warehouse tai Warehouse merkitään Tyyppi-sarakkeen kohdalla varastoksi. Varasto tukee tapahtumia, DDL- ja DML-kyselyitä.
Toisin kuin SQL-analytiikan päätepiste, joka tukee vain luku -kyselyitä ja näkymien ja TV-tiedostojen luomista, varastossa on täysi tapahtumamuotoinen DDL- ja DML-tuki, ja sen luo asiakas. Varasto täytetään jollakin tuetuista tietojen käsittelymenetelmistä, kuten KOPIOIMINEN SISÄÄN-, Putket-, Tietovuot- tai Tietokannan ristiinkäsittelyasetukset, kuten LUO TAULUKKO SELECT (CTAS) ja INSERT. VALITSE tai VALITSE SISÄÄN.
Lisätietoja Warehousen käytön aloittamisesta on artikkelissa Varaston luominen Microsoft Fabricissa.
Lakehousen varaston ja SQL-analytiikan päätepisteen vertailu
Tässä osiossa kuvataan Warehousen ja SQL-analytiikan päätepisteen väliset erot Microsoft Fabricissa.
SQL-analytiikan päätepiste on vain luku -muotoinen varasto, joka luodaan automaattisesti, kun se luodaan Microsoft Fabricin Lakehousesta. Lakehousen Sparkin kautta luodut Delta-taulukot löydetään automaattisesti SQL-analytiikan päätepisteestä taulukoina. SQL-analytiikan päätepisteen avulla datainsinöörit voivat luoda relaatiokerroksen fyysisten tietojen päälle Lakehousessa ja paljastaa sen analyysi- ja raportointityökaluille SQL-ühendusstring avulla. Tietoanalyytikot voivat sitten käyttää T-SQL:ää Lakehouse-tietojen käyttöön Synapse Data Warehousen avulla. SQL-analytiikan päätepisteen avulla voit suunnitella varastosi BI-tarpeisiin ja palvella tietoja.
Synapse Data Warehouse tai Warehouse on perinteinen tietovarasto, ja se tukee T-SQL-kaikkia tapahtumapohjaisia ominaisuuksia, kuten yrityksen tietovarastoa. Toisin kuin SQL-analytiikan päätepisteessä, jossa taulukot ja tiedot luodaan automaattisesti, pystyt täysin luomaan taulukoita, lataamaan, muuntamaan ja kyselemään tietoja tietovarastossa käyttämällä joko Microsoft Fabric -portaalia tai T-SQL-komentoja.
Lisätietoja tietojen kyselemisestä Microsoft Fabricissa on artikkelissa SQL-analytiikan päätepisteen kysely tai Microsoft Fabric -varasto.
Vertaa erilaisia varastointiominaisuuksia
Jotta analytiikan käyttötapaukset voidaan tarjota parhaalla mahdollisella tavalla, käytettävissäsi on useita ominaisuuksia. Yleensä varasto voidaan ajatella kaikkien muiden ominaisuuksien yläjoukkona, joka luo synergistisen suhteen kaikkien muiden T-SQL:ää tarjoavien analytiikkatarjonnan välille.
Microsoft Fabricissa on käyttäjiä, joiden on ehkä päätettävä varaston, Lakehousen ja jopa Power BI -tietomarssin välillä.
Microsoft Fabric -tarjous
Varasto
Lakehousen SQL-analytiikan päätepiste
Power BI -tietomarssi
Käyttöoikeudet
Fabric tai Power BI Premium
Fabric tai Power BI Premium
Vain Power BI Premiumissa
Ensisijaiset ominaisuudet
ACID-yhteensopiva, täysi tietovarasto ja tapahtumatuki T-SQL:ssä.
Vain luku -tilassa järjestelmän luoma SQL-analytiikan päätepiste Lakehouselle T-SQL-kyselyille ja tarjoilulle. Tukee analytiikkaa Lakehouse Delta -taulukoissa ja Delta Lake -kansioissa, joihin viitataan pikakuvakkeiden kautta.
Koodittomuustietojen varastointi ja T-SQL-kyselyt
Kehittäjäprofiili
SQL-kehittäjät tai citizen developers
Data-asiantuntijat tai SQL-kehittäjät
Vain citizen developer
Suositeltu käyttötapaus
- Tietojen varastointi suuryrityskäyttöön
- Tietovarastoa tukevat osastot, liiketoimintayksikkö tai omatoiminen käyttö
- T-SQL:n jäsennetty tietoanalyysi, joka sisältää taulukoita, näkymiä, toimintosanalioita ja funktioita sekä BI:n SQL-lisätuen
- Tutustuminen ja delta-taulukoiden kyseleminen Lakehousesta
- Valmistelutiedot ja arkistointivyöhyke analysointia varten
- Medallion Lakehouse -arkkitehtuuri vyöhykkeillä pronssi-, hopea- ja kulta-analyysia varten
- Yhdistäminen Warehousen kanssa yritysanalytiikan käyttötapauksia varten
- Pienen osaston tai liiketoimintayksikön varastointitapaukset
- Omatoiminen tietovarastoinnin käyttötapaukset
- Power BI -tietovoiden saapumisvyöhyke ja yksinkertainen BI:n SQL-tuki
Kehityskokemus
- Varastoeditori, joka tukee täysin T-SQL-tietojen käsittelylle, mallinnmiselle, kehitykselle ja kyselyille tietojen käsittelystä, mallinnuksista ja kyselyistä
- Luku- ja kirjoitustuki 1. ja kolmannen osapuolen työkaluille
- Lakehouse SQL -analytiikan päätepiste, jossa on rajoitettu T-SQL-tuki näkymille, taulukkoarvoisille funktioille ja SQL-kyselyille
- Käyttöliittymäkokemukset mallinnusta ja kyselyä varten
- Rajoitettu T-SQL-tuki 1. ja kolmannen osapuolen työkaluille
- Käyttöliittymäkokemusten ja kyselyiden tuki Datamart Editorissa
- Tietojen käsittely, mallinnus ja kyselyjen käyttöliittymäkokemus
- Vain luku -tuki 1. ja kolmannen osapuolen työkaluille
T-SQL-ominaisuudet
Täysi DQL-, DML- ja DDL T-SQL -tuki, täydellinen tapahtumatuki
Full DQL, No DML, limited DDL T-SQL Support kuten SQL Views ja TVF
Vain täysi DQL
Tietojen lataaminen
SQL, putket, tietovuot
Spark, putket, tietovuot, pikakuvakkeet
Vain tietovuot
Delta-taulukon tuki
Lukeminen ja kirjoittaminen Delta-taulukot
Lukee delta-taulukoita
Ei ole
Tallennuskerros
Avoin tietomuoto – Delta
Avoin tietomuoto – Delta
Ei ole
Automaattisesti muodostettu rakenne Lakehousen SQL-analytiikan päätepisteessä
SQL-analytiikan päätepiste hallitsee automaattisesti luotuja taulukoita, jotta työtilan käyttäjät eivät voi muokata niitä. Käyttäjät voivat täydentää tietokantamallia lisäämällä omia SQL-rakenteensa, näkymänsä, toimintosanansa ja muita tietokantaobjekteja.
Lakehousen jokaisesta Delta-taulukosta SQL-analytiikan päätepiste luo automaattisesti yhden taulukon.
SQL-analytiikan päätepisteen taulukot luodaan viiveellä. Kun luot tai päivität Delta Lake -kansion/-taulukon Lake-järjestelmässä, Lake-tietoihin viittaattavaa varastotaulukkoa ei luoda/päivitetä heti. Muutokset otetaan käyttöön varastossa 5–10 sekunnin kuluttua.
Jos haluat käyttää SQL-analytiikan päätepisteen automaattisesti luotuja rakennetietotyyppejä, tutustu ohjeartikkeliin Microsoft Fabricin tietotyypit.
Liittyvä sisältö
Palaute
https://aka.ms/ContentUserFeedback.
Tulossa pian: Vuoden 2024 aikana poistamme asteittain GitHub Issuesin käytöstä sisällön palautemekanismina ja korvaamme sen uudella palautejärjestelmällä. Lisätietoja on täällä:Lähetä ja näytä palaute kohteelle