Azure Synapse Linkin lisämääritysten asetukset

Azure Synapse Link tarjoaa useita tapoja kirjoittaa ja lukea tietoja erilaisiin analyysiskenaarioihin sopiviksi.

Huomautus

Azure Synapse Link for Dataverse tunnettiin aiemmin nimellä Vie Data Lakeen. Palvelu nimettiin uudelleen toukokuussa 2021, ja se jatkaa tietojen vientiä Azure Data Lake -tallennustilaan ja Azure Synapse Analyticsiin.

Tässä artikkelissa käsiteltävät asiat:

  1. Paikallaan-päivitykset verrattuna vain lisäys -kirjauksiin.
  2. Käyttäjän määrittämä tietojen osiointi.

Paikallaan-päivitykset verrattuna vain lisäys -kirjauksiin

Kun Dataverse-taulukon tietoja kirjoitetaan Azure Data Lake -tallennustilaan, valittavana on kaksi erilaista asetusta, ja tämä valinta perustuu createdOn-arvoon, joka ilmaisee tietueen luontipäivämäärän ja -ajan. Valittavana on asetukset Samaan sijaintiin päivittäminen ja Vain lisäys.

Oletusasetus (taulukoissa, joissa createdOn on käytettävissä) on samaan sijaintiin päivittäminen tai tietoja lisäävä upsert (päivitys tai lisäys) kohteessa. Jos muutos on uusi ja vastaavaa riviä ei ole uudella rivillä, luomiskohteen tapauksessa kohdetiedostot lisätään ja muutokset lisätään vastaavaan tiedoston osioon lakessa. Jos muutos on päivitys ja rivi on luotu aikaisemmin Data Lake -tallennustilaan, vastaa Data Lake -tiedosto päivitetään lisäävillä tiedoilla sen sijaan, että ne lisättäisiin. Toisin sanoen kaikkien sellaisten Dataverse-taulukoiden, joissa createdOn on saatavana, CUD (luonti, päivitys ja poisto) -muutosten oletusasetus on samaan sijaintiin päivittäminen kohteessa eli Azure Data Lake -tallennustilassa.

Oletusarvoisen samaan sijaintiin päivittämisen voi vaihtaa käyttämällä valinnaista Vain lisäys -asetusta. Samaan sijaintiin päivityksen sijaan Vain lisäys -tilassa Dataverse-taulukoiden lisäävät tiedot lisätään vastaavaan tiedosto-osioon Data Lake -tallennustilassa: Tämä taulukkokohtainen asetus on käytettävissä valintaruutuna kohdassaLisäasetukset > Näytä lisämääritysasetukset. Jos Vain lisäys on otettu käyttöön Dataverse-taulukossa, kaikki CUD-muutokset lisätään lisäävästi vastaaviin Data Lake -tallennustilan kohdetiedostoihin. Kun valitset tämän vaihtoehdon, osiostrategian oletusarvo on Vuosi ja kun tiedot kirjoitetaan Data Lake -tallennustilaan, ne jakautuvat vuosittain. Vain liittäminen on oletusasetus Dataverse-taulukoille , joissa ei ole createdOn-arvoa.

Seuraavassa taulukossa käsitellään rivien käsittelyä Data Lake -tallennustilassa CUD-tapahtumien perusteella kunkin tietojen kirjoitusvaihtoehdon osalta.

Tapahtuma Samaan sijaintiin päivittäminen Vain lisäys
Luo Rivi lisätään osiointitiedostoon rivin createdOn-arvon perusteella. Rivi lisätään osiointitiedoston loppuun tietueen createdOn-arvon perusteella.
Päivitys Jos rivi on osiotiedostossa, se korvataan tai päivitetään päivitetyllä tiedolla. Jos sitä ei ole luotu, se lisätään tiedostoon. Rivi ja päivitetty versio lisätään osiointitiedoston loppuun.
Delete Jos rivi on luotu osiointitiedostoon, se poistetaan tiedostosta. Rivi lisätään osiointitiedoston loppuun ja siinä on arvoIsDelete column = True.

Huomautus

Jos Vain lisäys on otettu käyttöön Dataverse-taulukossa, rivin poistaminen lähteessä ei poista riviä Data Lake -tallennustilassa. Poistettu rivi lisätään sen sijaan uutena rivinä Data Lake -tallennustilaan, ja isDeleted-sarakkeen arvoksi määritetään Tosi.

Palvelimettoman vahvistamaton lukeminen (ALLOW_INCONSISTENT_READS) on käytössä vain lisäys -tilassa. ALLOW_INCONSISTENT_READS tarkoittaa sitä, että käyttäjä voi lukea tiedostot, joita voidaan muokata jatkuvasti SELECT-kyselyn aikana. Tulokset ovat yhdenmukaisia ja ne vastaavat tiedoston tilannevedoksen lukemista. (Se ei vastaa tietokannan tilannevedoksen eristystä, koska tilannevedoksen luontiaika on erilainen.)

Vain lisäys ei sieppaa kaikkia CUD-muutoksia: Synapse Link käsittelee tietojen muutokset ryhminä eli erinä, ennen kuin ne julkaistaan Data Lake -tallennustilaan. Niinpä jos käyttäjä tekee tietyn lyhyen ajanjaksona aikana muutoksia, kaikkia CUD-muutoksia ei siepata Data Lake -tallennustilaan.

Seuraavassa on lisätietoja siitä, milloin kumpaakin vaihtoehtoa käytetään.

  • Paikkapäivitys: Tämä asetus on oletusasetus, ja sitä suositellaan vain, jos haluat muodostaa yhteyden suoraan Data Lake -tallennustilaan ja tarvitset nykyisen tilan (ei historiatietoja tai vaiheittaisia muutoksia). Tiedosto sisältää koko tietojoukon ja sitä voidaan käyttää Power BI:ssa tai kopioimalla koko ETL (purku, siirto, lataus) -putkien tietojoukko.
  • Vain lisäys: Tämä vaihtoehto valitaan, jos Data Lake -tallennustilan tietoihin ei muodosteta suoraan yhteyttä ja tiedot halutaan kopioida lisäävästi toiseen kohteeseen ETL-putkien avulla. Tämä vaihtoehto sisältää muutoslokin, minkä ansiosta tekoäly- ja koneoppimisskenaariot voidaan ottaa käyttöön.

Voit ottaa Näytä määrityksen lisäasetukset -valinnan käyttöön kohdassa Lisäasetukset Azure Synapse Link for Dataversessa mukauttaaksesi tieto-osiostrategiaasi ja valitaksesi Azure Data Lakeen kirjoittamisen asetuksia.

Näytä lisämääritykset.

Tietojen osiointi

Kun kirjoitat Dataverse-taulukkotietoja Azure data lake storageen käyttämällä Azure Synapse Linkiä, taulukot osioidaan (yksittäisen tiedoston asemesta) lakessa lähteen kunkin rivin createdOn-arvon perusteella. Oletusosiointistrategia on kuukausittain ja tiedot jaetaan Azure data lake -tallennustilassa kuukausittain.

Dataverse-taulukon kapasiteetin ja tietojen jakelun perusteella voit jakaa tiedot vuoden mukaan. Tämän vaihtoehdon avulla, kun Dataverse-taulukon tiedot kirjoitetaan Azure data lake -tallennustilaan, ne jaetaan vuosittain kunkin lähteen rivin createdOn-arvon perusteella. Jos taulukossa ei ole createdOn-saraketta, tietorivit jaetaan uuteen tiedostoon viiden miljoonan tietueen välein. Tämä taulukkokohtainen asetus on käytettävissä valintaruutuna kohdassaLisäasetukset > Näytä lisämääritysasetukset.

Lisätietoja on esimerkeissä siitä, miten tietoja käsitellään lakessa vuosi- tai kuukausiosiostrategian avulla:

Osiostrategia.

Katso myös

Azure Synapse Link for Dataverse

Huomautus

Voitko kertoa meille dokumentaatiota koskevan kielimäärityksesi? Vastaa lyhyeen kyselyyn. (Huomaa, että tämä kysely on englanninkielinen.)

Kyselyyn vastaaminen kestää noin seitsemän minuuttia. Henkilökohtaisia tietoja ei kerätä (tietosuojatiedot).