Делите путем


Ажурирање Common Data Model извора података за коришћење Delta табела

Ажурирајте постојеће податке за повезивање помоћу уобичајених табела модела података и преместите се у табеле у облику делте без уклањања и поновног стварања постојеће конфигурације која зависи од података за повезивање.

Кључни разлози за повезивање са подацима ускладиштеним у Делта формату:

  • Директно увезите податке делта форматираних да бисте уштедели време и труд.
  • Елиминишите трошкове израчунавања и складиштења повезане са трансформацијом и складиштењем копије података из језерске куће.
  • Аутоматски побољшајте поузданост уношења података коју обезбеђује Customer Insights - Data Делта верзија.

Делта је термин уведен са Делта Лаке, фондацијом за складиштење података и столова у Датабрицкс Лакехоусе платформи. Делта Лаке је опен-соурце стораге слој доноси ТРАНСАКЦИЈЕ КИСЕЛИНЕ (атеност, доследност, изолација и трајност) великим оптерећењима података. Више информација потражите на страници документације Делта језера.

Предуслови

  • Мора Azure Data Lake Storage бити у истом закупу и Азуре региону као Customer Insights - Data.

  • Директор Customer Insights - Data услуге мора да има податке о складиштењу сарадник за приступ налогу за складиштење. Више информација потражите у чланку Додељивање дозвола директору услуге за приступ налогу за складиштење.

  • Кориснику који подешаје или ажурира < ДИЦТ__извор података > дата соурце најмање дозволе за складиштење читалац података на налогу Azure Data Lake Storage .

  • Подаци ускладиштени у услугама на мрежи могу бити ускладиштени на другој локацији од места где се подаци обрађују или складиште. Увозом или повезивањем са подацима ускладиштеним у услугама на мрежи слажете се да се подаци могу пренети.  Сазнајте више у Мицрософт центру за поузданост.

  • Customer Insights - Data подржава Датабрицкс читалац верзији 2. Делта табеле које користе функције које захтевају Датабрицкс читалац верзија 3 или више нису подржане. Сазнајте више: Како Датабрицкс управља компатибилношћу Делта Лаке функција?

  • Табеле делта морају бити у фасцикли у контејнеру за складиштење и не могу бити у основном директоријуму контејнера. На пример:

    storageaccountcontainer/
        DeltaDataRoot/
           ADeltaTable/
                 _delta_log/
                     0000.json
                     0001.json
                 part-0001-snappy.parquet
                 part-0002-snappy.parquet
    
  • Делта табеле и њихова шема морају да се подударају са табелама у постојећем заједничком моделу података < ДИЦТ__извор података > дата соурце да буду у истом контејнеру за складиштење. Табеле у новој фасцикли са подацима морају се тачно подударати са изабраним табелама у окну "Уобичајени модел < ДИЦТ__извор података > дата соурце ". Имена табела и њихове шеме морају тачно да се подударају. У програму Делта имена табела су иста као име фасцикле у којој су подаци ускладиштени. Због тога се имена фасцикли морају тачно подударати са изабраним табелама у окну "Уобичајени модел < ДИЦТ__извор података > дата соурце ". У супротном, исправка не успе.

    На пример, ако су изабране табеле "Заједнички модел < ДИЦТ__извор података > дата соурце " "Tabela1" и "Tabela2", фасцикла коју одаберете за исправку мора да прикаже tabelu1 и tabelu2 у хијерархији.

    storageaccountroot/
    DeltaDataRoot/
        Table1/
        Table2/
    

Ажурирање заједничких табела података модела података у Делта табеле

  1. Идите на изворе > података података.

  2. Изаберите Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце а затим изаберите ажурирај у Делта табеле. Или кликните на дугме Започни исправку са странице "Додавање табела" ако уређујете заједнички модел < ДИЦТ__извор података > дата соурце.

    Страница извора података која приказује заједнички модел података < ДИЦТ__извор података > дата соурце </ДИЦТ__извор података > са истакнутим табелама ажурирања у делту.

  3. Изаберите опцију Прегледај и дођи до фасцикле која садржи податке у Делта формату и тачно се подудара са изабраном табелом Азуре < ДИЦТ__извор података > дата соурце података. Изаберите је, а затим изаберите ставку Ажурирај < ДИЦТ__извор података > дата соурце.

    Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".

    Важно

    Немојте заустављати процес освежавања јер би то могло негативно да утиче на < ДИЦТ__извор података > дата соурце.

    Савет

    Постоје статуси за задатке и процесе. Већина процеса зависи од других узводних процеса, као што су извори података и освежавање профилисања података.

    Изаберите статус да бисте отворили окно са детаљима о току и приказали ток задатака. Да бисте отказали посао, кликните на дугме " Откажи посао" на дну окна.

    У оквиру сваког задатка можете изабрати погледајте детаље за више информација о току, као што су време обраде, датум последње обраде и све применљиве грешке и упозорења повезана са задатком или процесом. Изаберите статус система "Прикажи " на дну табле да бисте видели друге процесе у систему.

Препоручујемо да наставите да стримујете податке на локацију Дата Лаке Стораге преко постојећег цевовода и одржавате манифесте и шеме док не утврдите да је ажурирање било успешно и све функционише на очекивани начин.

Врати конверзију из табела"Уобичајени модел података" у Делта табеле

Ако сте покушали да ажурирате Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце у Делта табеле и процес не успе, извршите следеће кораке.

Предуслови

  • Ваша организација је наставила да стримује податке о складиштењу података кроз ваш цевовод.
  • Ваша организација је одржавала манифесте и шеме складишта у језеру података.

Вратите се на Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце

  1. Идите на изворе > података података.

  2. Изаберите Азуре Дата Лаке Цоммон Дата Модел < ДИЦТ__извор података > дата соурце а затим изаберите ставку Врати у табеле Цоммон Дата Модел.

  3. Потврдите да желите да се вратите. Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".

    Важно

    Немојте заустављати процес освежавања јер би то могло негативно да утиче на враћање < ДИЦТ__извор података > дата соурце.