Напредне опције конфигурације у услузи Azure Synapse Link
Azure Synapse Link нуди више начина за писање и читање података у складу са различитим аналитичким сценаријима.
Напомена
Azure Synapse Link for Dataverse је раније био познат као „Извоз у језеро података“. Услуга је преименована у мају 2021. и наставиће да извози податке и у Azure Data Lake, као и у Azure Synapse Analytics.
Овај чланак покрива:
- Ажурирања на месту у односу на писање само за прилог.
- Кориснички дефинисана подела података.
Ажурирања на месту у односу на писање само за прилог
Док уписујете податке Dataverse табеле у Azure језеро података, на основу createdOn
вредности, а то је датум и време када је запис креиран, можете одабрати између два различита подешавања. То су, Ажурирање на месту и Само приложи.
Подразумевано подешавање (за табеле где је доступна опција createdOn
) је да се на месту изврши ажурирање или upsert (ажурирање или уметање) инкременталних података на одредишту. Ако је промена нова и одговарајући ред не постоји у језеру, у случају креирања, одредишне датотеке се скенирају, а промене се убацују у одговарајућу партицију датотеке у језеру. Ако је промена ажурирање и ред постоји у језеру, одговарајућа датотека у језеру се ажурира, а не убацује, са инкременталним подацима. Другим речима, подразумевана поставка за све ЦУД (креирање, ажурирање, брисање) промена Dataverse у табелама, createdOn
где је доступно, јесте да се изврши ажурирање на месту на одредишту, у Азуре језеру са подацима.
Можете да промените подразумевано понашање ажурирања на месту помоћу опционог подешавања које се зове Само додај. Уместо Ажурирање на месту, у Само додај режиму, инкрементални подаци из Dataverse табела се додају одговарајућој партицији датотеке у језеру. Ово је подешавање по табели и доступно је као поље за потврду у оквиру Напредно > Прикажи напредна подешавања конфигурације. За Dataverse табеле где је укључено Само додај, све CUD промене се поступно додају одговарајућим одредишним датотекама у језеру. Када одаберете ову опцију, подразумевана стратегија партиције је Година, а када се подаци упишу у језеро података, они се деле по годишњој основи. Само додај је такође подразумевана поставка за Dataverse табеле које немају createdOn
вредност.
Табела у наставку описује како се рукује редовима у језеру према CUD догађајима за сваку од опција писања података.
Догађај | Ажурирање на месту | Само прилагање |
---|---|---|
Креирај | Ред се умеће у датотеку партиције и заснован је на вредности за createdOn у реду. |
Ред се додаје на крај датотеке партиције и заснива се на вредности createdOn записа. |
Ажурирање | Ако ред постоји у датотеци партиције, тада се замењује или ажурира ажурираним подацима. Ако не постоји, убацује се у датотеку. | Ред, заједно са ажурираном верзијом, додаје се на крај датотеке партиције. |
Delete | Ако ред постоји у датотеци партиције, уклања се из датотеке. | Ред се додаје на крај датотеке партиције са IsDelete column = True . |
Напомена
За Dataverse табеле где је омогућено Само додај, брисање реда у извору неће избрисати или уклонити ред у језеру. Уместо тога, избрисани ред се додао као нови ред у језеру, а колона је постављена isDeleted
на вредност Труе.
Прљаво читање (АЛЛОW_ИНЦОНСИСТЕНТ_РЕАДС) за без сервера омогућено је само за режим за аморт. АЛЛОW _ИНЦОНСИСТЕНТ _РЕАДС значи да корисник може да чита датотеке које се могу стално мењати док SELECT
је упит покренут. Резултати ће бити доследни и еквивалентни читању снимка датотеке. (Није еквивалентно изолацији снимка базе података због различитог времена генерације снимка.)
Неће све ЦУД промене бити ухваћене само у додацима: Синапса Линк обрађује промене података у групама или "групама" пре него што их објави на језеру са подацима. Као резултат тога, ако корисник изврши промене у кратком временском интервалу, неће све ЦУД промене бити ухваћене у језеру са подацима.
Ево мало више детаља о томе када да користите коју од опција.
- Ажурирање на месту: Ова опција је подразумевана поставка и препоручује се само ако желите да се директно повежете са подацима у језеру и треба вам тренутни статус (не историја или инкременталне промене). Датотека садржи цео скуп података и можете се користити путем услуге Power BI или копирањем целокупног скупа података за ETL (Извоз, Трансфер, Учитавање) канале.
- Само додај: Изаберите ову опцију ако се не повезујете директно са подацима у језеру и желите поступно копирати податке на други циљ помоћу ETL канала. Ова опција обезбеђује историју промена како би били омогућени AI и ML сценарији.
Можете да пребаците опцију Прикажи напредна подешавања конфигурације у одељку Напредно у услузи Azure Synapse Link for Dataverse да бисте прилагодили стратегију партиције података и изабрали опције за писање у Azure Data Lake.
Подела података
Када уписујете податке табеле из услуге Dataverse у Azure Data Lake Storage помоћу услуге Azure Synapse Link, табеле су подељене (уместо једне датотеке) у језеру на основу вредности createdOn
на сваком реду у извору. Подразумевана стратегија поделе је по месецима, а подаци се деле у Azure језеру података месечно.
На основу обима Dataverse табеле и дистрибуције података, можете одабрати детаљнију стратегију партиционисања за поделу података по годинама. Са овом опцијом, када се подаци из Dataverse табеле се записују у Azure језеро података, делиће се годишње на основу вредности createdOn
на сваком реду у извору. За табеле без createdOn
колоне, редови података се поделе у нову датотеку сваких #пии_ииииииијјз записа. Ово је подешавање по табели и доступно је као поље за потврду у оквиру Напредно > Прикажи напредна подешавања конфигурације.
Више детаља са примерима како се рукује подацима у језеру са годишњом или месечном стратегијом поделе:
Погледајте и
Azure Synapse Link for Dataverse
Напомена
Можете ли нам рећи о својим жељеним поставкама језика у документацији? Испуните кратку анкету. (имајте на уму да је ова анкета на енглеском језику)
Анкета ће трајати око седам минута. Не прикупљају се лични подаци (изјава о приватности).
Повратне информације
https://aka.ms/ContentUserFeedback.
Стиже ускоро: Током 2024. године постепено ћемо укидати проблеме са услугом GitHub као механизам повратних информација за садржај и заменити га новим системом повратних информација. За додатне информације, погледајте:Пошаљите и прегледајте повратне информације за