Microsoft Fabric -terminologia

Artikkeli
05/21/2024

Tutustu Microsoft Fabricissa käytettyjen termien määritelmiin, mukaan lukien Synapse Data Warehousea, Synapse Data Engineeringia, Synapse Data Sciencea, reaaliaikaista tiedustelua, Data Factorya ja Power BI:tä koskevat termit.

Yleiset ehdot

Kapasiteetti: Kapasiteetti on erillinen resurssijoukko, joka on käytettävissä tiettynä ajankohtana. Kapasiteetti määrittää resurssin mahdollisuuden suorittaa toiminto tai tuottaa tulosta. Eri kohteet kuluttavat eri kapasiteettia tiettynä ajankohtana. Fabric tarjoaa kapasiteettia Fabric SKU:n ja Trials-kokeilujen kautta. Lisätietoja on ohjeartikkelissa Mikä on kapasiteetti?
Käyttökokemus: tämä on kokoelma ominaisuuksia, jotka on kohdistettu tiettyyn toimintoon. Fabric-käyttökokemuksiin kuuluvat Synapse-tietovarasto, Synapse-tietotekniikka, Synapse Data Science, reaaliaikainen tiedustelu, datatehdas ja Power BI.
Kohde: Kohde, joka on joukko ominaisuuksia käyttökokemuksessa. Käyttäjät voivat luoda, muokata ja poistaa niitä. Jokainen kohdetyyppi tarjoaa eri ominaisuuksia. Esimerkiksi Tietotekniikka-kokemus sisältää lakehouse-, muistikirja- ja Spark-työmääritelmäkohteet.
Vuokraaja: Vuokraaja on yksi organisaation Fabric-esiintymä, jonka tunnuksena on Microsoft Entra.
Työtila: Työtila on kokoelma kohteita, jotka yhdistävät eri toiminnot yhteen ympäristöön, joka on suunniteltu yhteistyötä varten. Se toimii säilönä, joka käyttää kapasiteettia suoritettavalle työlle ja tarjoaa ohjausobjekteja sille, ketkä voivat käyttää sen kohteita. Esimerkiksi työtilassa käyttäjät luovat raportteja, muistikirjoja, semanttisia malleja jne. Katso lisätietoja artikkelista Työtilat .

Synapse Data Engineering

Lakehouse: Lakehouse on kokoelma tiedostoja, kansioita ja taulukoita, jotka edustavat tietokantaa Data Lake -järvestä, jota Apache Spark -moduuli ja SQL-moduuli käyttävät massadatan käsittelyyn. Lakehouse sisältää parannetut ominaisuudet ACID-tapahtumiin, kun käytetään avoimen lähdekoodin Delta-muotoiltuja taulukoita. Lakehouse-kohdetta isännöidään yksilöllisessä työtilakansiossa Microsoft OneLakessa. Se sisältää tiedostoja eri muodoissa (jäsennetty ja rakenteeton) järjestettynä kansioihin ja alikansioihin. Lisätietoja on kohdassa Mikä lakehouse on?
Notebook: Fabric-muistikirja on monikielinen vuorovaikutteinen ohjelmointityökalu, jossa on monipuolisia funktioita. Näitä ovat esimerkiksi koodin ja markdownin luominen, Spark-työn suorittaminen ja valvonta, tuloksen tarkasteleminen ja visualisointi sekä yhteistyö tiimin kanssa. Sen avulla datainsinöörit ja datatieteilijät voivat tutkia ja käsitellä tietoja sekä kehittää koneoppimiskokeiluja sekä koodissa että vähäisessä koodaamisessa. Se voidaan helposti muuntaa jaksotoiminnaksi orkestroinniksi.
Spark-sovellus: Apache Spark -sovellus on käyttäjän kirjoittama ohjelma, joka käyttää jotakin Sparkin ohjelmointirajapintakielistä (Scala, Python, Spark SQL tai Java) tai Microsoftin lisäämiä kieliä (.NET C#:n kanssa tai F#). Kun sovellus suoritetaan, se jaetaan yhteen tai useampaan Spark-työhän, jotka suoritetaan rinnakkain tietojen käsittelemiseksi nopeammin. Lisätietoja on artikkelissa Spark-sovellusten valvonta.
Apache Spark -työ: Spark-työ on osa Spark-sovellusta, joka suoritetaan rinnakkain sovelluksen muiden töiden kanssa. Työ koostuu useista tehtävistä. Lisätietoja on artikkelissa Spark-työn valvonta.
Apache Spark -työn määritelmä: Spark-työmääritelmä on käyttäjän määrittämä parametrijoukko, joka ilmaisee, miten Spark-sovellus tulisi suorittaa. Sen avulla voit lähettää erä- tai suoratoistotöitä Spark-klusteriin. Jos haluat lisätietoja, katso Mikä on Apache Spark -työn määritelmä?
V-järjestys: Kirjoitusoptimointi parquet-tiedostomuotoon, joka mahdollistaa nopean lukemisen ja tarjoaa kustannustehokkuuden ja paremman suorituskyvyn. Kaikki Fabric-moottorit kirjoittavat oletusarvoisesti v-tilattuja parquet-tiedostoja.

Data Factory

Yhdistin: Data Factory tarjoaa monipuolisen joukon liittimiä, joiden avulla voit muodostaa yhteyden erityyppisiin tietosäilöihin. Kun yhteys on muodostettu, voit muuntaa tiedot. Katso lisätietoja kohdasta Liittimet.
Tietoputki: Data Factoryssa tietojen siirron ja muunnoksen järjestämiseen käytetään tietoputkia. Nämä putket eroavat Fabricin käyttöönottoputkista. Lisätietoja on datatehtaan yleiskatsauksen kohdassa Putket .
Tietovuo Gen2: Tietovuot tarjoavat vähäisen koodin rajapinnan, jonka avulla voit käsitellä tietoja sadoista tietolähteistä ja muuntaa tietojasi. Fabric-tietovoita kutsutaan nimellä Tietovuo Gen2. Tietovuo Gen1 on olemassa Power BI:ssä. Tietovuo Gen2 tarjoaa lisäominaisuuksia verrattuna Azure Data Factoryn tai Power BI:n tietovoihin. Et voi päivittää Gen1:stä Gen2:een. Lisätietoja on Data Factory -yleiskatsauksen kohdassa Tietovuot .
Käynnistin: Data Factoryn automaatio-ominaisuus, joka käynnistää putkia tiettyjen ehtojen, kuten aikataulujen tai tietojen käytettävyyden, perusteella.

Synapse Data Science

Data Wrangler: Data Wrangler on muistikirjapohjainen työkalu, joka tarjoaa käyttäjille mukaansatempaavan kokemuksen tutkivien tietoanalyysien tekemiseen. Ominaisuus yhdistää ruudukon kaltaisen tietojen näytön dynaamisiin yhteenvetotilastoihin ja yleisiin tietojenpuhdistustoimintoihin, jotka ovat kaikki käytettävissä muutamilla valituilla kuvakkeilla. Jokainen toiminto luo koodin, joka voidaan tallentaa takaisin muistikirjaan uudelleenkäytettävänä komentosarjana.
Kokeilu: Koneoppimisen kokeilu on organisaation ja hallinnan ensisijainen yksikkö kaikissa siihen liittyvissä koneoppimisajoissa. Lisätietoja on artikkelissa Microsoft Fabricin koneoppimiskokeilut.
Malli: Koneoppimismalli on tiedosto, joka on harjoitettu tunnistamaan tietyntyyppiset mallit. Harjoitat mallin tietojoukolla ja annat sille algoritmin, jonka avulla se päättelee ja oppii tästä tietojoukosta. Lisätietoja on kohdassa Koneoppimismalli.
Suorita: Suoritus vastaa mallikoodin yksittäistä suoritusta. MLflow-ympäristössä seuranta perustuu kokeisiin ja suoritukset.

Synapse-tietovarasto

SQL-analytiikan päätepiste: Each Lakehousessa on SQL-analytiikan päätepiste, jonka avulla käyttäjä voi tehdä kyselyn delta-taulukon tiedoista TSQL:n ja TDS:n avulla. Lisätietoja on artikkelissa SQL-analytiikan päätepiste.
Synapse Data Warehouse: Synapse Data Warehouse toimii perinteisenä tietovarastona ja tukee kaikkia tapahtumapohjaisia T-SQL-ominaisuuksia, joita voit odottaa yrityksen tietovarastosta. Lisätietoja on kohdassa Synapse-tietovarasto.

Reaaliaikainen tieto

KQL-tietokanta: KQL-tietokanta sisältää tietoja muodossa, jossa voit suorittaa KQL-kyselyitä. Lisätietoja on artikkelissa Kysely KQL-tietokannasta.
KQL-kyselyjoukko: KQL-kyselyjoukko on kohde, jota käytetään kyselyiden suorittamiseen, tulosten tarkasteluun ja kyselytulosten muokkaamiseen Data Explorer -tietokannan tiedoista. Kyselyjoukko sisältää tietokannat ja taulukot, kyselyt ja tulokset. KQL-kyselyjoukon avulla voit tallentaa kyselyt tulevaa käyttöä varten tai viedä ja jakaa kyselyitä muiden kanssa. Lisätietoja on artikkelissa Tietojen kyseleminen KQL-kyselyjoukossa
Tapahtumavirta: Microsoft Fabric -tapahtumavirrat -ominaisuus tarjoaa Fabric-ympäristöön keskitetyn paikan reaaliaikaisten tapahtumien sieppaamiseen, muuntamiseen ja reititykseen kohteisiin ilman koodausta. Tapahtumavirta koostuu erilaisista suoratoistettavasta tietolähteestä, käsittelykohteista ja tapahtumasuorittimesta, kun muunnosta tarvitaan. Katso lisätietoja Microsoft Fabric -tapahtumavirroista.

OneLake

Pikakuvake: Pikakuvakkeet ovat OneLakessa upotettuja viittauksia, jotka osoittavat muihin tiedostosäilön sijainteihin. Ne tarjoavat tavan muodostaa yhteys olemassa oleviin tietoihin ilman, että niitä tarvitsee kopioida suoraan. Lisätietoja on kohdassa OneLake-pikakuvakkeet.

Jaa

Microsoft Fabric -terminologia

Yleiset ehdot

Synapse Data Engineering

Data Factory

Synapse Data Science

Synapse-tietovarasto

Reaaliaikainen tieto

OneLake

Palaute

Palaute

Lisäresursseja

Jaa

Microsoft Fabric -terminologia

Yleiset ehdot

Synapse Data Engineering

Data Factory

Synapse Data Science

Synapse-tietovarasto

Reaaliaikainen tieto

OneLake

Liittyvä sisältö

Palaute

Palaute

Lisäresursseja