Täpsema konfiguratsiooni suvandid rakenduses Azure Synapse Link
Azure Synapse Link pakub mitut võimalust andmete kirjutamiseks ja lugemiseks, et need sobiksid erinevate analüüsistsenaariumitega.
Märkus
Azure Synapse Link for Dataverse oli varem tuntud kui Eksportimine andmejärve. Teenus nimetati 2021. aasta mais ümber ja see jätkab andmete eksportimist nii Azure Data Lake'i kui ka Azure Synapse Analyticsisse.
See artikkel sisaldab järgmist.
- Kohapealsed värskendused ja ainult lisatavad kirjutised.
- Kasutaja määratud eraldamisstrateegia.
Kohapealsed värskendused ja ainult lisatavad kirjutised
Dataverse 'i tabeliandmete Azure'i data lake'i kirjutamiseks, põhinedes createdOn
väärtusel, mis on kirje loomise kuupäev ja kellaaeg, tuleb valida kahe erineva sätte vahel. Need on, Kohapealne värskendus ja Lõpprežiim.
Vaikesäte (tabelite puhul, kus createdOn
on saadaval) on teha kohapealne astmeliste andmete ajakohane värskendamine või upsert. Kui muudatus on uus ja järves pole korrespondeeruvat rida, sel juhul loomise puhul on sihtfailid skänneeritud ja muudatused sisestatud korrespondeeruvasse järvesektsiooni. Kui muudatus on värskendus ja rida on järves olemas, korrespondeeruv fail on järves pigem värskendatud ja mitte sisestatud koos astmeliste andmetega. Teisisõnu, kõigi CUD-i (looge, värskendage, kustutage) muudatuste vaikesäte tabelites Dataverse , kus createdOn
see on saadaval, on teha kohapealne värskendus sihtkohas, Azure’i andmejärves.
Saate vahetada olemasolevat värskenduse vaikekäitumist, kasutades valikulist sätet nimega Lõpurežiim. Kohavärskenduse asemel, Lõpurežiimi olekus, astmelised andmed Dataverse tabelitest on liidetud korrespondeeruvale failisektsioonile järves. See on tabeli kohta käiv säte ja kättesaadav märkeruuduna jaotises Täpsem > Näita täpsemaid konfiguratsioonisätteid. Dataverse tabelites Lõpurežiim sisse lülitatud, kõik CUD muudatused on astmeliselt liidetud korrespondeeruvate sihtkohafailidega järves. Kui valite selle suvandi, siis jaotusstrateegia vaikeväärtuseks on Aasta ja kui andmed on kirjutatud andmejärve, on see jaotatud aasta lõikes. Lisa ainult on samuti vaikeväärtus Dataverse tabelites, millel pole createdOn
väärtust.
Allolevas tabelis on kirjeldatud, kuidas käsitletakse seal ridu vastavalt CUD-sündmustele iga andmekirjutussuvandi kohta.
Üritus | Kohapealne värskendamine | Lisa ainult |
---|---|---|
Koosta | Rida lisatakse partitsioonfaili ja põhineb rea createdOn väärtusel. |
Rida lisatakse partitsioonfaili lõppu ja põhineb createdOn kirje väärtusel. |
Värskendus | Kui rida on partitsioonfailis olemas, asendatakse või värskendatakse see värskendatud andmetega. Kui seda pole olemas, lisatakse see faili. | Rida koos värskendatud versiooniga lisatakse partitsioonfaili lõppu. |
Delete | Kui rida on partitsioonfailis olemas, eemaldatakse see failist. | Rida lisatakse partitsioonifaili lõppu koos IsDelete column = True . |
Märkus
Dataverse-i tabelites, kus on lubatud Lõpurežiim , kustutades allikarea ei kustuta või eemalda see rida järvest. Selle asemel lisatakse kustutatud rida järves uue reana ja isDeleted
veeru väärtuseks seatakse Tõene.
Serverita määrdunud lugemine (ALLOW_INCONSISTENT_READS) on lubatud ainult lisamisrežiimis. ALLOW_INCONSISTENT_READS tähendab, et kasutaja saab lugeda faile, mida saab päringu töötamise ajal SELECT
pidevalt muuta. Tulemused on järjepidevad ja samaväärsed faili hetktõmmise lugemisega. (See ei ole samaväärne andmebaasi hetktõmmise eraldamisega, kuna hetktõmmise genereerimise aeg on erinev.)
Kõiki CUD-i muudatusi ei jäädvustata ainult lisas: Synapse Link töötleb andmete muudatusi rühmades või "partiides" enne nende avaldamist andmejärves. Selle tulemusena, kui kasutaja teeb muudatusi lühikese ajavahemiku jooksul, ei jäädvustata andmejärves kõiki CUD-i muudatusi.
Siin on mõned täiendavad üksikasjad selle kohta, millal kumba suvandit kasutada.
- Kohapealne värskendamine: See on vaikesäte ja soovitatav ainult juhul, kui soovite luua ühenduse otse andmetega järves ja vajate praegust olekut (mitte ajalugu või astmelisi muudatusi). Fail sisaldab täielikku andmekogumit ja seda saab kasutada Power BI kaudu kopeerides terve andmekogumi ETL-i (ekstrakti, edastuse, koormuse) konveieritele.
- Lõppurežiim: Valige see suvand, kui te ei ühenda otse andmeidjärve ja soovite andmeid astmeliselt kopeerida andmeid mõnda muusse sihtmärki kasutades ETL konveiereid. See suvand pakub muudatuste ajalugu AI ja ML stsenaariumides.
Andmete eraldamisstrateegia kohandamiseks ja Azure data lake kirjutamise suvandite valimiseks saate jaotises Täpsemad konfiguratsioonisätted jaotises Täpsemalt rakenduses Azure Synapse Link for Dataverse kuvada täpsemad konfiguratsioonisätted.
Andmete eraldamine
Kui Dataverse tabeliandmed Azure Data Lake Storage Azure Synapse Link abil jaotatakse, jaotatakse tabelid andmejärves (ühe faili asemel) lähtekoha iga rea väärtuse createdOn
põhjal. Vaikejagamisstrateegia on kuu kaupa ja andmed jagatakse Azure andmejärve kuu-põhiselt.
Dataverse tabeli mahu ja andmete jaotuse põhjal saate valida rohkem piirkonnapõhise eraldamisstrateegia andmete aastapõhiseks jagamiseks. Selle suvandi korral, kui tabeliandmed kirjutatakse Dataverse Azure andmejärve, jagatakse need võttes aluseks lähterea iga createdOn
rea väärtuse. Veeruta createdOn
tabelite puhul jaotatakse andmeread iga 5,000,000 kirje järel uude faili. See on tabeli kohta käiv säte ja kättesaadav märkeruuduna jaotises Täpsem > Näita täpsemaid konfiguratsioonisätteid.
Täiendavad üksikasjad, kus on toodud näited andmete iga-aastase või igakuise eraldamisstrateegiaga töötlemise kohta järves:
Vt ka
Azure Synapse Link for Dataverse
Märkus
Kas saaksite meile dokumentatsiooniga seotud keele-eelistustest teada anda? Osalege lühikeses uuringus. (Uuring on ingliskeelne.)
Uuringus osalemine võtab umbes seitse minutit. Isikuandmeid ei koguta (privaatsusavaldus).