Делите путем


Напредне опције конфигурације у услузи Azure Synapse Link

Azure Synapse Link нуди више начина за писање и читање података у складу са различитим аналитичким сценаријима.

Напомена

Azure Synapse Link for Dataverse је раније био познат као „Извоз у језеро података“. Услуга је преименована у мају 2021. и наставиће да извози податке и у Azure Data Lake, као и у Azure Synapse Analytics.

Овај чланак покрива:

  1. Ажурирања на месту у односу на писање само за прилог.
  2. Кориснички дефинисана подела података.

Ажурирања на месту у односу на писање само за прилог

Док уписујете податке Dataverse табеле у Azure језеро података, на основу createdOn вредности, а то је датум и време када је запис креиран, можете одабрати између два различита подешавања. То су, Ажурирање на месту и Само приложи.

Подразумевано подешавање (за табеле где је доступна опција createdOn) је да се на месту изврши ажурирање или upsert (ажурирање или уметање) инкременталних података на одредишту. Ако је промена нова и одговарајући ред не постоји у језеру, у случају креирања, одредишне датотеке се скенирају, а промене се убацују у одговарајућу партицију датотеке у језеру. Ако је промена ажурирање и ред постоји у језеру, одговарајућа датотека у језеру се ажурира, а не убацује, са инкременталним подацима. Другим речима, подразумевана поставка за све ЦУД (креирање, ажурирање, брисање) промена Dataverse у табелама, createdOn где је доступно, јесте да се изврши ажурирање на месту на одредишту, у Азуре језеру са подацима.

Можете да промените подразумевано понашање ажурирања на месту помоћу опционог подешавања које се зове Само додај. Уместо Ажурирање на месту, у Само додај режиму, инкрементални подаци из Dataverse табела се додају одговарајућој партицији датотеке у језеру. Ово је подешавање по табели и доступно је као поље за потврду у оквиру Напредно > Прикажи напредна подешавања конфигурације. За Dataverse табеле где је укључено Само додај, све CUD промене се поступно додају одговарајућим одредишним датотекама у језеру. Када одаберете ову опцију, подразумевана стратегија партиције је Година, а када се подаци упишу у језеро података, они се деле по годишњој основи. Само додај је такође подразумевана поставка за Dataverse табеле које немају createdOn вредност.

Табела у наставку описује како се рукује редовима у језеру према CUD догађајима за сваку од опција писања података.

Догађај Ажурирање на месту Само прилагање
Креирај Ред се умеће у датотеку партиције и заснован је на вредности за createdOn у реду. Ред се додаје на крај датотеке партиције и заснива се на вредности createdOn записа.
Ажурирање Ако ред постоји у датотеци партиције, тада се замењује или ажурира ажурираним подацима. Ако не постоји, убацује се у датотеку. Ред, заједно са ажурираном верзијом, додаје се на крај датотеке партиције.
Delete Ако ред постоји у датотеци партиције, уклања се из датотеке. Ред се додаје на крај датотеке партиције са IsDelete column = True.

Напомена

За Dataverse табеле где је омогућено Само додај, брисање реда у извору неће избрисати или уклонити ред у језеру. Уместо тога, избрисани ред се додао као нови ред у језеру, а колона је постављена isDeleted на вредност Труе.

Прљаво читање (АЛЛОW_ИНЦОНСИСТЕНТ_РЕАДС) за без сервера омогућено је само за режим за аморт. АЛЛОW _ИНЦОНСИСТЕНТ _РЕАДС значи да корисник може да чита датотеке које се могу стално мењати док SELECT је упит покренут. Резултати ће бити доследни и еквивалентни читању снимка датотеке. (Није еквивалентно изолацији снимка базе података због различитог времена генерације снимка.)

Неће све ЦУД промене бити ухваћене само у додацима: Синапса Линк обрађује промене података у групама или "групама" пре него што их објави на језеру са подацима. Као резултат тога, ако корисник изврши промене у кратком временском интервалу, неће све ЦУД промене бити ухваћене у језеру са подацима.

Ево мало више детаља о томе када да користите коју од опција.

  • Ажурирање на месту: Ова опција је подразумевана поставка и препоручује се само ако желите да се директно повежете са подацима у језеру и треба вам тренутни статус (не историја или инкременталне промене). Датотека садржи цео скуп података и можете се користити путем услуге Power BI или копирањем целокупног скупа података за ETL (Извоз, Трансфер, Учитавање) канале.
  • Само додај: Изаберите ову опцију ако се не повезујете директно са подацима у језеру и желите поступно копирати податке на други циљ помоћу ETL канала. Ова опција обезбеђује историју промена како би били омогућени AI и ML сценарији.

Можете да пребаците опцију Прикажи напредна подешавања конфигурације у одељку Напредно у услузи Azure Synapse Link for Dataverse да бисте прилагодили стратегију партиције података и изабрали опције за писање у Azure Data Lake.

Прикажи напредну конфигурацију.

Подела података

Када уписујете податке табеле из услуге Dataverse у Azure Data Lake Storage помоћу услуге Azure Synapse Link, табеле су подељене (уместо једне датотеке) у језеру на основу вредности createdOn на сваком реду у извору. Подразумевана стратегија поделе је по месецима, а подаци се деле у Azure језеру података месечно.

На основу обима Dataverse табеле и дистрибуције података, можете одабрати детаљнију стратегију партиционисања за поделу података по годинама. Са овом опцијом, када се подаци из Dataverse табеле се записују у Azure језеро података, делиће се годишње на основу вредности createdOn на сваком реду у извору. За табеле без createdOn колоне, редови података се поделе у нову датотеку сваких #пии_ииииииијјз записа. Ово је подешавање по табели и доступно је као поље за потврду у оквиру Напредно > Прикажи напредна подешавања конфигурације.

Више детаља са примерима како се рукује подацима у језеру са годишњом или месечном стратегијом поделе:

Стратегија поделе.

Погледајте и

Azure Synapse Link for Dataverse

Напомена

Можете ли нам рећи о својим жељеним поставкама језика у документацији? Испуните кратку анкету. (имајте на уму да је ова анкета на енглеском језику)

Анкета ће трајати око седам минута. Не прикупљају се лични подаци (изјава о приватности).