Deli putem


Napredne opcije konfiguracije u Azure Synapse Link

Azure Synapse Link nudi više načina za pisanje i čitanje podataka u skladu sa različitim analitičkim scenarijima. U zavisnosti od vašeg analitičkog scenarija, možete odabrati određenu konfiguraciju iz opcija ispod.

Scenario Odnosi se na Dostupne opcije konfiguracije
Operativno izveštavanje Dataverse Tabele, finansije i operacije tabele i entiteti Sinapse Analitika sa opcijom Delta lake pruža bolje vreme odgovor na upit, posebno primenljivo za upite velikih količina podataka. Više informacija: Sinapse Link sa opcijom Delta jezera
Operativno izveštavanje Dataverse samo tabele Sinapse Link sa opcijom konfiguracije "Ažuriranje na mestu" obezbeđuje CSV datoteke u vašem jezeru podataka koje se ažuriraju u realnom vremenu

Ovo je nasleđena opcija dostupna za Dataverse tabele. Ova opcija nije podržana za tabele iz aplikacije za finansije i operacije
Integracija podataka Dataverse Tabele i finansije i operacije tabele i entiteti "Opcija Append only obezbeđuje CSV datoteke koje sadrže inkrementalne podatke. Možete izgraditi cevovode koji troše inkrementalne podatke i popunjavaju nizvodne sisteme

Korisnički specificirana funkcija particije podataka omogućava da izaberete prilagođenu strategiju particionisanja podataka posebno za Dataverse tabele. Podaci tabele finansija i operacija su podeljeni od strane sistema na osnovu odgovarajuće strategije particije. Ova opcija nije dostupna za aplikacije za finansije i operacije

Belešku

Azure Synapse Link for Dataverse ranije je bio poznat kao izvoz u jezero podataka. Usluga je preimenovana na snagu maja 2021. godine i nastaviće da izvozi podatke, kao Azure Data Lake Storage i Azure Synapse Analytics. Počevši od septembra 2023. godine, Azure Synapse Link takođe vam omogućava da izaberete podatke iz Dynamics 365 finansijskih i operativnih aplikacija. Nisu svi obrasci integracije podržani sa aplikacije za finansije i operacije. Za uputstva o prelasku sa funkcije izvoza u jezero podataka u aplikacijama za finansije i operacije u Sinapse Link, idite na Vodič za tranziciju.

Ovaj članak pokriva napredne postavke konfiguracije dostupne za Dataverse tabele. Ove opcije nisu dostupne za aplikacije za finansije i operacije.

  1. Ažuriranja na mestu u odnosu na pisanje samo za prilog.
  2. Korisnički definisana podela podataka.

Ažuriranja na mestu u odnosu na pisanje samo za prilog

Prilikom pisanja Dataverse podataka tabele u Azure jezero podataka, na osnovu createdOn vrednosti, koja je datum i vreme kada je zapis kreiran, postoje dve različite postavke koje možete izabrati. Oni su, na mestu ažuriranje i samo dodati.

Podrazumevano podešavanje (za tabele gde createdOn je dostupan) je da se uradi ažuriranje na mestu ili upsert (ažuriranje ili umetanje) inkrementalnih podataka u odredištu. Ako je promena nova i odgovarajući red ne postoji u jezeru, u slučaju kreiranja, odredišne datoteke se skeniraju, a promene se ubacuju u odgovarajuću particiju datoteke u jezeru. Ako je promena ažuriranje i red postoji u jezeru, odgovarajuća datoteka u jezeru se ažurira, a ne ubacuje, sa inkrementalnim podacima. Drugim rečima, podrazumevana postavka za sve CUD (kreiranje, ažuriranje, brisanje) promene u Dataverse tabelama, gde createdOn je dostupno, jeste da se uradi ažuriranje na mestu u odredištu, u Azure Data Lake.

Možete da promenite podrazumevano ponašanje ažuriranja na mestu korišćenjem opcionog podešavanja pod nazivom Samo dodavanje. Umesto ažuriranja na mestu, u režimu samo za dodavanje , inkrementalni podaci iz Dataverse tabela se dodaju odgovarajućoj particiji fajlova u jezeru. Ovo je postavka po tabeli i dostupna je kao polje za potvrdu pod Advanced >Show naprednim podešavanjima konfiguracije. Za Dataverse tabele sa uključenim samo dodavanjem , sve CUD promene se inkrementalno dodaju odgovarajućim odredišnim datotekama u jezeru. Kada izaberete ovu opciju, strategija particije podrazumeva Godina i kada se podaci zapisuju u jezero podataka, oni su podeljeni po godišnjoj osnovi. Samo dodavanje je takođe podrazumevano podešavanje za Dataverse tabele koje nemaju createdOn vrednost.

Ova tabela opisuje kako se redovi obrađuju u jezeru protiv CUD događaja za svaku od opcija pisanja podataka.

Događaj Ažuriranje na mestu Samo prilaganje
Kreiranje Red je ubačen u fajl particije i zasniva se na createdOn vrednosti u redu. Red se dodaje na kraj particionog fajla i zasniva se na createdOn vrednosti zapisa.
Ažuriranje Ako red postoji u datoteci particije, tada se zamenjuje ili ažurira ažuriranim podacima. Ako ne postoji, ubacuje se u datoteku. Red, zajedno sa ažuriranom verzijom, dodaje se na kraj datoteke particije.
Delete Ako red postoji u datoteci particije, uklanja se iz datoteke. Red se dodaje na kraj particionog fajla sa IsDelete column = True.

Belešku

Za Dataverse tabele u kojima je omogućeno samo dodavanje, brisanje reda u izvornom kodu neće obrisati ili ukloniti red u jezeru. Umesto toga, obrisani red se dodaje kao novi red u jezeru i kolona je podešena isDeleted na True.

Prljavo čitanje (ALLOW_INCONSISTENT_READS) za serverless je omogućeno samo za režim dodavanja. ALLOW_INCONSISTENT_READS znači da je korisnik u mogućnosti da čita datoteke koje se mogu stalno menjati dok SELECT je upit pokrenut. Rezultati će biti konzistentni i ekvivalentni čitanju snimak datoteke. (To nije ekvivalentno izolaciji snimak baze podataka zbog različitog vremena generisanja snimak.)

Neće sve promene CUD biti zarobljene samo udodatku: Sinapse Link obrađuje promene u podacima u grupama ili "serijama" pre nego što ih objavi u jezeru podataka. Kao rezultat toga, ako korisnik izvrši promene u kratkom vremenskom intervalu, neće sve promene CUD biti zarobljene u jezeru podataka.

Evo malo više detalja o tome kada da koristite koju od opcija.

  • Ažuriranje na mestu: Ova opcija je podrazumevana postavka i preporučuje se samo ako želite da se direktno povežete sa podacima u jezeru i treba vam trenutno stanje (ne istorija ili inkrementalne promene). Datoteka sadrži ceo skup podataka i možete se koristiti putem usluge Power BI ili kopiranjem celokupnog skupa podataka za ETL (Izvoz, Transfer, Učitavanje) kanale.
  • Samo dodavanje: Izaberite ovu opciju ako se ne povezujete direktno sa podacima u jezeru i želite da inkrementalno kopirate podatke na drugi cilj koristeći ETL cevovode. Ova opcija obezbeđuje istoriju promena kako bi bili omogućeni AI i ML scenariji.

Možete da uključite Prikaži napredne postavke konfiguracije pod Napredno da Azure Synapse Link for Dataverse prilagodite strategiju particije podataka i izaberete opcije za pisanje u Azure Data Lake.

Pokaži naprednu konfiguraciju.

Podela podataka

Kada pišete Dataverse podatke tabele u Azure Data Lake Storage korišćenjem Azure Synapse Link, tabele su particionisane (umesto jedne datoteke) u jezeru na osnovu createdOn vrednosti u svakom redu u izvoru. Podrazumevana strategija podele je po mesecima, a podaci se dele u Azure jezeru podataka mesečno.

Na osnovu obima Dataverse tabele i distribucije podataka, možete odabrati detaljniju strategiju particionisanja za podelu podataka po godinama. Sa ovom opcijom, kada Dataverse se podaci tabele upisuju u Azure Data Lake, oni će biti podeljeni na godišnjem nivou na osnovu createdOn vrednosti na svakom redu u izvoru. Za tabele createdOn bez kolone, redovi podataka su podeljeni u novi fajl svaki 5,000,000 zapisa. Ovo je postavka po tabeli i dostupna je kao polje za potvrdu pod Napredna>ponuda naprednih podešavanja konfiguracije.

Više detalja sa primerima kako se rukuje podacima u jezeru sa godišnjom ili mesečnom strategijom podele:

Strategija particije.

Pogledajte i ovo

Azure Synapse Link for Dataverse