Täpsema konfiguratsiooni suvandid rakenduses Azure Synapse Link

Azure Synapse Link pakub mitut võimalust andmete kirjutamiseks ja lugemiseks, et need sobiksid erinevate analüüsistsenaariumitega.

Märkus

Azure Synapse Link for Dataverse oli varem tuntud kui Eksportimine andmejärve. Teenus nimetati 2021. aasta mais ümber ja see jätkab andmete eksportimist nii Azure Data Lake'i kui ka Azure Synapse Analyticsisse.

See artikkel sisaldab järgmist.

  1. Kohapealsed värskendused ja ainult lisatavad kirjutised.
  2. Kasutaja määratud eraldamisstrateegia.

Kohapealsed värskendused ja ainult lisatavad kirjutised

Dataverse 'i tabeliandmete Azure'i data lake'i kirjutamiseks, põhinedes createdOn väärtusel, mis on kirje loomise kuupäev ja kellaaeg, tuleb valida kahe erineva sätte vahel. Need on, Kohapealne värskendus ja Lõpprežiim.

Vaikesäte (tabelite puhul, kus createdOn on saadaval) on teha kohapealne astmeliste andmete ajakohane värskendamine või upsert. Kui muudatus on uus ja järves pole korrespondeeruvat rida, sel juhul loomise puhul on sihtfailid skänneeritud ja muudatused sisestatud korrespondeeruvasse järvesektsiooni. Kui muudatus on värskendus ja rida on järves olemas, korrespondeeruv fail on järves pigem värskendatud ja mitte sisestatud koos astmeliste andmetega. Teisisõnu, kõigi CUD-i (looge, värskendage, kustutage) muudatuste vaikesäte tabelites Dataverse , kus createdOn see on saadaval, on teha kohapealne värskendus sihtkohas, Azure’i andmejärves.

Saate vahetada olemasolevat värskenduse vaikekäitumist, kasutades valikulist sätet nimega Lõpurežiim. Kohavärskenduse asemel, Lõpurežiimi olekus, astmelised andmed Dataverse tabelitest on liidetud korrespondeeruvale failisektsioonile järves. See on tabeli kohta käiv säte ja kättesaadav märkeruuduna jaotises Täpsem > Näita täpsemaid konfiguratsioonisätteid. Dataverse tabelites Lõpurežiim sisse lülitatud, kõik CUD muudatused on astmeliselt liidetud korrespondeeruvate sihtkohafailidega järves. Kui valite selle suvandi, siis jaotusstrateegia vaikeväärtuseks on Aasta ja kui andmed on kirjutatud andmejärve, on see jaotatud aasta lõikes. Lisa ainult on samuti vaikeväärtus Dataverse tabelites, millel pole createdOn väärtust.

Allolevas tabelis on kirjeldatud, kuidas käsitletakse seal ridu vastavalt CUD-sündmustele iga andmekirjutussuvandi kohta.

Üritus Kohapealne värskendamine Lisa ainult
Koosta Rida lisatakse partitsioonfaili ja põhineb rea createdOn väärtusel. Rida lisatakse partitsioonfaili lõppu ja põhineb createdOn kirje väärtusel.
Värskendus Kui rida on partitsioonfailis olemas, asendatakse või värskendatakse see värskendatud andmetega. Kui seda pole olemas, lisatakse see faili. Rida koos värskendatud versiooniga lisatakse partitsioonfaili lõppu.
Delete Kui rida on partitsioonfailis olemas, eemaldatakse see failist. Rida lisatakse partitsioonifaili lõppu koos IsDelete column = True.

Märkus

Dataverse-i tabelites, kus on lubatud Lõpurežiim , kustutades allikarea ei kustuta või eemalda see rida järvest. Selle asemel lisatakse kustutatud rida järves uue reana ja isDeleted veeru väärtuseks seatakse Tõene.

Serverita määrdunud lugemine (ALLOW_INCONSISTENT_READS) on lubatud ainult lisamisrežiimis. ALLOW_INCONSISTENT_READS tähendab, et kasutaja saab lugeda faile, mida saab päringu töötamise ajal SELECT pidevalt muuta. Tulemused on järjepidevad ja samaväärsed faili hetktõmmise lugemisega. (See ei ole samaväärne andmebaasi hetktõmmise eraldamisega, kuna hetktõmmise genereerimise aeg on erinev.)

Kõiki CUD-i muudatusi ei jäädvustata ainult lisas: Synapse Link töötleb andmete muudatusi rühmades või "partiides" enne nende avaldamist andmejärves. Selle tulemusena, kui kasutaja teeb muudatusi lühikese ajavahemiku jooksul, ei jäädvustata andmejärves kõiki CUD-i muudatusi.

Siin on mõned täiendavad üksikasjad selle kohta, millal kumba suvandit kasutada.

  • Kohapealne värskendamine: See on vaikesäte ja soovitatav ainult juhul, kui soovite luua ühenduse otse andmetega järves ja vajate praegust olekut (mitte ajalugu või astmelisi muudatusi). Fail sisaldab täielikku andmekogumit ja seda saab kasutada Power BI kaudu kopeerides terve andmekogumi ETL-i (ekstrakti, edastuse, koormuse) konveieritele.
  • Lõppurežiim: Valige see suvand, kui te ei ühenda otse andmeidjärve ja soovite andmeid astmeliselt kopeerida andmeid mõnda muusse sihtmärki kasutades ETL konveiereid. See suvand pakub muudatuste ajalugu AI ja ML stsenaariumides.

Andmete eraldamisstrateegia kohandamiseks ja Azure data lake kirjutamise suvandite valimiseks saate jaotises Täpsemad konfiguratsioonisätted jaotises Täpsemalt rakenduses Azure Synapse Link for Dataverse kuvada täpsemad konfiguratsioonisätted.

Täpsema konfiguratsiooni kuvamine.

Andmete eraldamine

Kui Dataverse tabeliandmed Azure Data Lake Storage Azure Synapse Link abil jaotatakse, jaotatakse tabelid andmejärves (ühe faili asemel) lähtekoha iga rea väärtuse createdOn põhjal. Vaikejagamisstrateegia on kuu kaupa ja andmed jagatakse Azure andmejärve kuu-põhiselt.

Dataverse tabeli mahu ja andmete jaotuse põhjal saate valida rohkem piirkonnapõhise eraldamisstrateegia andmete aastapõhiseks jagamiseks. Selle suvandi korral, kui tabeliandmed kirjutatakse Dataverse Azure andmejärve, jagatakse need võttes aluseks lähterea iga createdOn rea väärtuse. Veeruta createdOn tabelite puhul jaotatakse andmeread iga 5,000,000 kirje järel uude faili. See on tabeli kohta käiv säte ja kättesaadav märkeruuduna jaotises Täpsem > Näita täpsemaid konfiguratsioonisätteid.

Täiendavad üksikasjad, kus on toodud näited andmete iga-aastase või igakuise eraldamisstrateegiaga töötlemise kohta järves:

Sektsiooni strateegia.

Vt ka

Azure Synapse Link for Dataverse

Märkus

Kas saaksite meile dokumentatsiooniga seotud keele-eelistustest teada anda? Osalege lühikeses uuringus. (Uuring on ingliskeelne.)

Uuringus osalemine võtab umbes seitse minutit. Isikuandmeid ei koguta (privaatsusavaldus).