Ажурирање Common Data Model извора података за коришћење Delta табела
Ажурирајте постојеће податке за повезивање помоћу уобичајених табела модела података и преместите се у табеле у облику делте без уклањања и поновног стварања постојеће конфигурације која зависи од података за повезивање.
Кључни разлози за повезивање са подацима ускладиштеним у Делта формату:
- Директно увезите податке делта форматираних да бисте уштедели време и труд.
- Елиминишите трошкове израчунавања и складиштења повезане са трансформацијом и складиштењем копије података из језерске куће.
- Аутоматски побољшајте поузданост уношења података коју обезбеђује Customer Insights - Data Делта верзија.
Делта је термин уведен са Делта Лаке, фондацијом за складиштење података и столова у Датабрицкс Лакехоусе платформи. Делта Лаке је опен-соурце стораге слој доноси ТРАНСАКЦИЈЕ КИСЕЛИНЕ (атеност, доследност, изолација и трајност) великим оптерећењима података. Више информација потражите на страници документације Делта језера.
Предуслови
Мора Azure Data Lake Storage бити у истом закупу и Азуре региону као Customer Insights - Data.
Директор Customer Insights - Data услуге мора да има податке о складиштењу сарадник за приступ налогу за складиштење. Више информација потражите у чланку Додељивање дозвола директору услуге за приступ налогу за складиштење.
Кориснику који подешаје или ажурира < ДИЦТ__извор података > дата соурце најмање дозволе за складиштење читалац података на налогу Azure Data Lake Storage .
Подаци ускладиштени у услугама на мрежи могу бити ускладиштени на другој локацији од места где се подаци обрађују или складиште. Увозом или повезивањем са подацима ускладиштеним у услугама на мрежи слажете се да се подаци могу пренети. Сазнајте више у Мицрософт центру за поузданост.
Customer Insights - Data подржава Датабрицкс читалац верзији 2. Делта табеле које користе функције које захтевају Датабрицкс читалац верзија 3 или више нису подржане. Сазнајте више: Како Датабрицкс управља компатибилношћу Делта Лаке функција?
Табеле делта морају бити у фасцикли у контејнеру за складиштење и не могу бити у основном директоријуму контејнера. На пример:
storageaccountcontainer/ DeltaDataRoot/ ADeltaTable/ _delta_log/ 0000.json 0001.json part-0001-snappy.parquet part-0002-snappy.parquet
Делта табеле и њихова шема морају да се подударају са табелама у постојећем заједничком моделу података < ДИЦТ__извор података > дата соурце да буду у истом контејнеру за складиштење. Табеле у новој фасцикли са подацима морају се тачно подударати са изабраним табелама у окну "Уобичајени модел < ДИЦТ__извор података > дата соурце ". Имена табела и њихове шеме морају тачно да се подударају. У програму Делта имена табела су иста као име фасцикле у којој су подаци ускладиштени. Због тога се имена фасцикли морају тачно подударати са изабраним табелама у окну "Уобичајени модел < ДИЦТ__извор података > дата соурце ". У супротном, исправка не успе.
На пример, ако су изабране табеле "Заједнички модел < ДИЦТ__извор података > дата соурце " "Tabela1" и "Tabela2", фасцикла коју одаберете за исправку мора да прикаже tabelu1 и tabelu2 у хијерархији.
storageaccountroot/ DeltaDataRoot/ Table1/ Table2/
Ажурирање заједничких табела података модела података у Делта табеле
Идите на изворе > података података.
Изаберите Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце а затим изаберите ажурирај у Делта табеле. Или кликните на дугме Започни исправку са странице "Додавање табела" ако уређујете заједнички модел < ДИЦТ__извор података > дата соурце.
Изаберите опцију Прегледај и дођи до фасцикле која садржи податке у Делта формату и тачно се подудара са изабраном табелом Азуре < ДИЦТ__извор података > дата соурце података. Изаберите је, а затим изаберите ставку Ажурирај < ДИЦТ__извор података > дата соурце.
Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".
Важно
Немојте заустављати процес освежавања јер би то могло негативно да утиче на < ДИЦТ__извор података > дата соурце.
Савет
Постоје статуси за задатке и процесе. Већина процеса зависи од других узводних процеса, као што су извори података и освежавање профилисања података.
Изаберите статус да бисте отворили окно са детаљима о току и приказали ток задатака. Да бисте отказали посао, кликните на дугме " Откажи посао" на дну окна.
У оквиру сваког задатка можете изабрати погледајте детаље за више информација о току, као што су време обраде, датум последње обраде и све применљиве грешке и упозорења повезана са задатком или процесом. Изаберите статус система "Прикажи " на дну табле да бисте видели друге процесе у систему.
Препоручујемо да наставите да стримујете податке на локацију Дата Лаке Стораге преко постојећег цевовода и одржавате манифесте и шеме док не утврдите да је ажурирање било успешно и све функционише на очекивани начин.
Врати конверзију из табела"Уобичајени модел података" у Делта табеле
Ако сте покушали да ажурирате Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце у Делта табеле и процес не успе, извршите следеће кораке.
Предуслови
- Ваша организација је наставила да стримује податке о складиштењу података кроз ваш цевовод.
- Ваша организација је одржавала манифесте и шеме складишта у језеру података.
Вратите се на Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце
Идите на изворе > података података.
Изаберите Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце а затим изаберите ставку Врати у табеле Цоммон Дата Модел.
Потврдите да желите да се вратите. Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".
Важно
Немојте заустављати процес освежавања јер би то могло негативно да утиче на враћање < ДИЦТ__извор података > дата соурце.