Делите путем


Azure Synapse Link for Dataverse – Најчешћа питања

Овај чланак пружа информације о најчешћим питањима о извозу података Microsoft Dataverse табеле у Azure Synapse Analytics и Azure Data Lake.

Могу ли ручно обављати задатке као што су креирање, ажурирање, брисање или постављање политика аутоматског брисања за датотеке са подацима у повезаном Азуре складишту?

Датотеке са подацима не би требало да буду модификоване од стране купца и никакве датотеке са клијентима не би требало да буду смештене у фасцикле са подацима.

Напомена

Да бисте испустили устајале и стагнирајуће податке у језеру података без прекида, Azure Synapse Link размислите о коришћењу функције Упит и анализирајте инкрементална ажурирања

Како могу да приступим релацијама између табела?

Да бисте приступили односи много-на-више, однос је доступан као табела за одабир са странице Додај табеле за нову везу и из Управљање табелама за већ постојећу везу.

Напомена

Сви односи подаци су подразумевано у режиму само за додавање када су написани у ЦСВ формату.

Azure Synapse Link је бесплатна функција са Dataverse. Коришћење Azure Synapse Link for Dataverse не изазива додатне трошкове под. Dataverse Међутим, размотрите потенцијалне трошкове за Азуре услугу:

Шта се дешава када додам колону?

Када додате нову колону у табелу у изворном коду, она је такође додата на крају фајла у одредишту у одговарајућој фајл партицији. Док редови који су постојали пре додавања колоне нису приказани у новој колони, нови или ажурирани редови приказују ново додату колону.

Шта се дешава када избришем колону?

Када избришете колону из табеле у извору, колона није испуштена са одредишта. Уместо тога, редови се више не ажурирају и означавају се као нула уз очување претходних редова.

Шта се дешава ако променим тип података колоне?

Промена типа података колоне је прекидна промена и потребно је да се повежете и поново повежете.

Шта се дешава када избришем ред?

Брисање реда обрађује се различито на основу изабраних опција уписивања података:

  • Ажурирање на месту са ЦСВ форматом: Ово је подразумевани режим. Када избришете ред табеле у овом режиму, ред се такође брише из одговарајуће партиције података у Азуре Дата Лаке. Другим речима, подаци се тешко бришу са одредишта.
  • Само додатак са ЦСВ форматом и инкременталним ажурирањем фасцикле: У овом режиму, када се избрише ред табеле Dataverse , није тешко избрисан са одредишта. Уместо тога, ред се додаје и поставља као isDeleted=True датотека у одговарајућој партицији података у Азуре Дата Лаке.
  • Извоз у формат Делта језера: Azure Synapse Link врши меко брисање података током следећег циклуса делта синхронизације, након чега следи хард делете након 30 дана.

Зашто не видим заглавље колоне у извезеној датотеци?

Azure Synapse Link прати заједнички модел података како би се омогућило да се подаци и његово значење деле у апликацијама и пословним процесима као што су Microsoft Power Apps Power BI Динамицс КСНУМКС и Азуре. У сваком ЦДМ фолдеру, метаподаци као заглавље колоне се чувају у датотеци модел.јсон. Више информација: Заједнички модел података и Azure Data Lake Storage Gen2 | Microsoft Learn

Зашто се Модел.јсон датотека повећава или мења у дужини за типове података и не задржава оно што је дефинисано у Dataverse?

Модел .јсон задржава дужину базе података за величину колоне. Dataverse има концепт дужине базе података за сваку колону. Ако креирате колону величине 200 и касније је смањите на 100, Dataverse и даље дозвољава да постојећи подаци буду присутни Dataverse. То чини држећи DBLength се 200 и MaxLength 100. Оно што видите у Модел.јсон је и DBLength ако то користите за низводне процесе, никада нећете обезбедити мање простора за своје Dataverse колоне.

Напомена

Мемо поља су дефинисана као varchar(max) подразумевана максимална дужина 9999.

Који формати датума и времена могу да се очекују у извезеним Dataverse табелама?

Постоје три формата датума и времена које можете да очекујете у извезеним Dataverse табелама.

Назив колоне Облик Тип података Пример
SinkCreatedOn и SinkModifiedOn M/d/yyyy H:mm:ss tt Датум/време 6/28/2021 4:34:35 PM
CreatedOn yyyy-MM-dd'T'HH:mm:ss.sssssssXXX datetimeOffset 2018-05-25T16:21:09.0000000+00:00
Све остале колоне yyyy-MM-dd'T'HH:mm:ss'Z' Датум/време 2021-06-25T16:21:12Z

Напомена

ЦреатедОн тип података промењен од datetime до datetimeOffset на 07/29/2022. Да бисте уредили формат типа података за табелу креирану пре промене, испустите и поново додајте табелу.

Можете изабрати различита понашања колона за колону Датум и време у Dataverse, која ажурира формат типа података. Још информација: Понашање и форматирање колона Датум и време

Зашто видим 1.цсв или 1_001.цсв имена датотека уместо уобичајених датума и времена подељених имена датотека за неке Dataverse табеле?

Ово понашање се очекује када изаберете режим извоза само за додавање и имате табеле без важеће колоне ЦреатедОн . Блобови су организовани у фајлове као што су 1.цсв, 2.цсв (користећи прилагођено партиционисање због одсуства важећег датума креирања). Када се било која партиција приближи 95% од МаxБлоцкПерБлобЛимит, систем аутоматски генерише нови фајл—илустровано овде као 1_001.цсв.

Када би требало да користим годишњу или месечну стратегију поделе?

За Dataverse табеле у којима је обим података велик у року од годину дана, препоручујемо вам употребу месечних партиција. То резултира мањим датотекама и бољим перформансама. Поред тога, ако се редови у Dataverse табелама често ажурирају, раздвајање на више мањих датотека помаже у побољшању перформанси у случају сценарија ажурирања на лицу места. Делта Лаке је доступан само са годишњом партицијом због својих супериорних перформанси у односу на ЦСВ формат.

Шта је режим само за додавање и која је разлика између само додавања и режима ажурирања на лицу места?

У режиму само додавања, инкрементални подаци из Dataverse табела се додају одговарајућој партицији фајла у језеру. За више информација: Напредне опције конфигурације у Azure Synapse Link

Када да користим режим додавања само за историјски приказ промена?

Режим „Само додај“ је препоручена опција за писање података Dataverse табеле у језеро, посебно када је количина података велика у партицији са подацима који се често мењају. Опет, ово је често коришћена и топло препоручена опција за пословне кориснике. Поред тога, овај режим можете да користите за сценарије у којима је намера постепени преглед промена Dataverse и обрадити промене за ETL, AI и ML сценарије. Режим „Само додај“ пружа историју промена, уместо најновије промене или ажурирања на месту, и омогућава неколико временских серија из AI сценарија, попут предвиђања или аналитике прогнозирања засновану на историјским вредностима.

Како да преузмем најсавременији ред сваког записа и искључим избрисане редове када извозим податке у режиму само додавања?

У режиму додавања само, требало би да идентификујете најновију верзију записа са истим ИД-ом користећи VersionNumber и SinkModifiedOn затим примените isDeleted=0 на најновију верзију.

Зашто видим дуплиране бројеве верзија када извозим податке користећи само режим додавања?

За режим само за додавање, ако Azure Synapse Link for Dataverse не добије потврду из Азуре језера података да су подаци извршени из било ког разлога, као што су кашњења мреже, Azure Synapse Link покушаће поново у тим сценаријима и поново урезивати податке. Низводна потрошња треба да буде отпорна на овај сценарио филтрирањем података користећи SinkModifiedOn.

Зашто видим разлике у колонама Синкмодифиедон и Модифиедон?

То је очекивано. Modifiedon је датум и време у којем се запис мења Dataverse; Sinkmodifiedon је датум и време када се запис мења у језеру података.

Које Dataverse табеле нису подржане за извоз?

Свака табела која нема омогућено праћење промена није подржана поред следећих системских табела:

  • Прилог
  • Календар
  • Calendarrule

Напомена

Можете додати табелу ревизије за извоз користећи Azure Synapse Link for Dataverse. Међутим, извоз табеле ревизије је подржан само са профилима Делта Лаке.

Користим функцију извоза у делта језеро, могу ли зауставити Apache Spark посао или променити време извршења?

Делта Лаке конверзија посао се активира када је дошло до промене података у конфигурисаном временском интервалу. Не постоји могућност да се заустави или паузира базен. Apache Spark Међутим, можете да измените временски интервал након креирања везе под Управљање табелама > Напредни временски интервал.

Колоне за претрагу се састоје од ИД-а и вредности. Вредности претраге се мењају само на корену табели. Да бисте боље одражавали вредност колоне за претрагу, препоручујемо да се придружите оригиналној коренској табели да бисте добили најновију вредност.

У Dataverse, израчунате колоне задржавају само информације о формули, а стварна вредност зависи од колоне основне табеле. Дакле, израчунате колоне су подржане само када се све колоне налазе у истој извезеној табели.

Које Dataverse табеле подразумевано користе само режим додавања?

Све табеле које немају цреатедОн поље је синхронизовано коришћењем додавања само режим по дефаулту. Ово укључује табеле односа и табелу АцтивитиПартy.

Зашто видим поруку о грешци - Садржај директоријума на путу не може бити наведен?

  • Dataverse Подаци се чувају у повезаном контејнеру за складиштење. Потребна вам је улога "Стораге Блоб Дата сарадник" на повезаном рачуну за складиштење да бисте извршили операције читања и упита путем Синапсе Wоркспаце-а.
  • Ако одлучите да извозите податке у формату Делта Лаке, ваша ЦСВ датотека се чисти након конверзије Делта Лаке. Потребно је да упитате податке са нон_партитионед табелама преко Синапсе Wоркспаце-а.

Зашто видим поруку о грешци - не могу масовно учитати јер је датотека непотпуна или се не може прочитати (само ЦСВ датотека)?

Dataverse подаци се могу непрестано мењати кроз креирање, ажурирање и брисање трансакција. Ова грешка је узрокована основном датотеком која се мења када читате податке из ње. Дакле, за табеле са сталним променама, промените свој цевовод потрошње да бисте користили снимак податке (партициониране табеле) за потрошњу. Више информација: Решавање проблема без сервера СКЛ базен

Azure Synapse Link for Dataverse је дизајниран за аналитичке сврхе. Препоручујемо корисницима да користе дугорочно задржавање у архивске сврхе. Више информација: Dataverse преглед дугорочног задржавања података

Зашто не видим никакве промене података у језеру података када су записи избрисани Dataverse?

За било који директан СКЛ позив за уклањање записа, Azure Synapse Link for Dataverse услуга се не активира јер БПО. Делете се не зове. За функцију узорка идите на Како очистити наслеђени приступ.

Погледајте и

Azure Synapse Link for Dataverse