Bendrinti naudojant


Prisijungimas prie delta lentelių Azure Data Lake Storage

Prisijunkite prie duomenų Delta lentelėse ir perkelkite juos į vidų Dynamics 365 Customer Insights - Data.

Pagrindinės priežastys prisijungti prie duomenų, saugomų delta formatu:

  • Tiesiogiai importuokite "Delta" suformatuotus duomenis, kad sutaupytumėte laiko ir pastangų.
  • Pašalinkite skaičiavimo ir saugojimo išlaidas, susijusias su jūsų ežero namo duomenų kopijos transformavimu ir saugojimu.
  • Automatiškai pagerinkite duomenų įsisavinimo patikimumą, kurį Customer Insights - Data teikia "Delta" versijų kūrimas.

Palaikomos "Databricks" funkcijos ir versijos

Customer Insights - Data palaiko Databricks funkcijas su 2 ar senesne "minReaderVersion". "Databricks" funkcijos, kurioms reikalinga "Databricks Reader" 3 arba naujesnė versija, nepalaikomos. Lentelėje pateikiamos palaikomos ir nepalaikomos "Databricks" funkcijos.

Palaikomos funkcijos Nepalaikomos funkcijos
Pagrindinės funkcijos Delecijos vektoriai
Duomenų informacijos santraukos keitimas Skysčių grupavimas
Patikrinkite apribojimus Lentelės funkcijos rašo
Stulpelių susiejimas Laiko žymaNTZ
Stulpelių generavimas Tipo išplėtimas
Tapatybės stulpeliai Variantas
Eilučių sekimas
Lentelės funkcijos skaitomos
Vienodas

Sužinokite daugiau: Kaip "Databricks" valdo "Delta Lake" funkcijų suderinamumą?.

Būtinosios sąlygos

  • Turi Azure Data Lake Storage būti tame pačiame nuomotojuje ir "Azure" regione kaip ir Customer Insights - Data.

  • Paslaugos Customer Insights - Data vykdytojas turi turėti didelių saugyklos duomenų bendradarbio teises, kad galėtų pasiekti saugyklos paskyrą. Daugiau informacijos ieškokite Teisių suteikimas pagrindinei tarnybos įstaigai, kad ji galėtų pasiekti saugyklos abonementą.

  • Vartotojui, kuris nustato arba atnaujina duomenų šaltinis, reikia bent saugyklos didelių dvejetainių objektų duomenų skaitytuvo Azure Data Lake Storage leidimų paskyroje.

  • Internete teikiamose paslaugose saugomi duomenys gali būti saugomi kitoje vietoje nei ta, kurioje duomenys apdorojami ar saugomi. Importuodami internete teikiamose paslaugose saugomus duomenis arba prisijungdami prie jų sutinkate, kad duomenys gali būti perduodami.  Sužinokite daugiau apsilankę "Microsoft" patikimumo centre.

  • Customer Insights - Data palaiko "Databricks Reader" 2 versiją. Delta lentelės, kuriose naudojamos funkcijos, kurioms reikalinga 3 ar naujesnės versijos "Databricks Reader", nepalaikomos. Sužinokite daugiau: Palaikomos "Databricks" funkcijos.

  • Deltos lentelės turi būti saugojimo konteinerio aplanke ir negali būti konteinerio šakniniame kataloge. Pavyzdys.

    storageaccountcontainer/
        DeltaDataRoot/
           ADeltaTable/
                 _delta_log/
                     0000.json
                     0001.json
                 part-0001-snappy.parquet
                 part-0002-snappy.parquet
    
  • Jūsų Azure Data Lake Storage duomenys turi būti "Delta" lentelėse. Customer Insights - Data Remiasi versijos ypatybe lentelės retrospektyvoje, kad identifikuotų naujausius papildomo apdorojimo pakeitimus.

Prisijungimas prie "Delta" duomenų iš Azure Data Lake Storage

  1. Eikite į Duomenų>šaltiniai.

  2. Pasirinkite Įtraukti duomenų šaltinis.

  3. Pasirinkite Azure Data Lake Delta lentelės.

    Dialogo langas, kuriame reikia įvesti išsamią Deltos ežero ryšio informaciją.

  4. Įveskite duomenų šaltinio pavadinimas ir pasirinktinį aprašą. Pavadinimas nurodomas tolesniuose procesuose ir sukūrus duomenų šaltinis jo pakeisti neįmanoma.

  5. Pasirinkite vieną iš šių parinkčių Saugyklos prijungimas naudojant.

    • "Azure" prenumerata: pasirinkite Prenumerata , tada išteklių grupė ir saugyklos paskyra.
    • "Azure" išteklius: įveskite ištekliaus ID.
  6. Pasirinktinai, jei norite perkelti duomenis iš saugyklos paskyros naudodami "Azure Private" susieti, pasirinkite Įgalinti privatų susieti. Norėdami gauti daugiau informacijos, žiūrėkite Privatūs saitai.

  7. Pasirinkite konteinerio , kuriame yra jūsų duomenų aplankas, pavadinimą ir pasirinkite Pirmyn.

  8. Eikite į aplanką, kuriame yra delta lentelių duomenys, ir pasirinkite jį. Tada pasirinkite Pirmyn. Rodomas galimų lentelių sąrašas.

  9. Pasirinkite lenteles, kurias norite įtraukti.

  10. Pasirinktose lentelėse, kuriose pirminis raktas nėra apibrėžtas, būtina rodoma dalyje Pirminis raktas. Kiekvienai iš šių lentelių:

    1. Pasirinkite Būtina. Rodomas skydelis Redaguoti lentelę .
    2. Pasirinkite pirminį raktą. Pirminis raktas yra unikalus lentelės atributas. Kad atributas būtų tinkamas pirminis raktas, jame neturėtų būti pasikartojančių reikšmių, trūkstamų reikšmių arba neapibrėžtų reikšmių. Eilutės, sveikojo skaičiaus ir GUID duomenų tipo atributai palaikomi kaip pirminiai raktai.
    3. Pasirinkite Uždaryti , kad išsaugotumėte ir uždarytumėte skydelį.

    Dialogo langas, kuriame rodoma Būtina pirminiam raktui

  11. Norėdami įgalinti duomenų profiliavimą bet kuriame stulpelyje, pasirinkite lentelės stulpelių skaičių . Rodomas puslapis Tvarkyti atributus .

    Dialogo langas, skirtas duomenų profiliavimui pasirinkti.

    1. Pasirinkite Duomenų profiliavimas visai lentelei arba konkretiems stulpeliams. Pagal numatytuosius nustatymus jokia lentelė neįjungta duomenų profiliavimui.
    2. Pasirinkite Atlikta.
  12. Pasirinkite Įrašyti. Atidaromas puslapis Duomenų šaltiniai , kuriame naujas duomenų šaltinis rodomas būsenoje Atnaujinimas .

    Arbatpinigiai

    Yra užduočių ir procesų būsenos . Dauguma procesų priklauso nuo kitų pirminių procesų, pvz., duomenų šaltinių ir duomenų profiliavimo atnaujinimų.

    Pasirinkite būseną, kad atidarytumėte sritį Eigos informacija ir peržiūrėtumėte užduočių eigą. Norėdami atšaukti užduotį, srities apačioje pasirinkite Atšaukti užduotį .

    Po kiekviena užduotimi galite pasirinkti Peržiūrėti išsamią informaciją , kad gautumėte daugiau informacijos apie eigą, pvz., apdorojimo laiką, paskutinę apdorojimo datą ir visas taikomas klaidas bei įspėjimus, susijusius su užduotimi ar procesu. Pasirinkite Peržiūrėti sistemos būseną skydelio apačioje, kad pamatytumėte kitus sistemos procesus.

Duomenų įkėlimas gali užtrukti. Sėkmingai atnaujinus, suvartotus duomenis galima peržiūrėti puslapyje Lentelės .

Schemos keitimų valdymas

Kai stulpelis įtraukiamas arba pašalinamas iš delta aplankų schemos duomenų šaltinis, sistema vykdo visišką duomenų atnaujinimą. Visiškas atnaujinimas užtrunka ilgiau, kol apdorojami visi duomenys, nei laipsniški atnaujinimai.

Stulpelio įtraukimas

Kai stulpelis įtraukiamas į duomenų šaltinis, informacija automatiškai pridedama prie duomenų Customer Insights - Data , kai tik įvyksta atnaujinimas. Jei lentelės suvienijimas jau sukonfigūruotas, naujas stulpelis turi būti įtrauktas į suvienijimo procesą.

  1. Atlikdami veiksmą Kliento duomenys pasirinkite Pasirinkti lenteles ir stulpelius ir pasirinkite naują stulpelį.

  2. Atlikdami vieningo duomenų rodinio veiksmą įsitikinkite, kad stulpelis nėra išskirtas iš kliento profilio. Pasirinkite Išskirta ir perskaitykite stulpelį.

  3. Atlikdami vieningo profilio veiksmo naujinimus pasirinkite Suvienodinti klientų profilius ir priklausomybes.

Stulpelio keitimas arba šalinimas

Kai stulpelis pašalinamas iš duomenų šaltinis, sistema tikrina, ar nėra priklausomybių kituose procesuose. Jei yra priklausomybė nuo stulpelių, sistema sustabdo atnaujinimą ir pateikia klaidą, nurodančią, kad priklausomybės turi būti pašalintos. Šios priklausomybės rodomos pranešime, kad būtų lengviau jas rasti ir pašalinti.

Schemos pakeitimo tikrinimas

Kai duomenų šaltinis bus atnaujintas, eikite į puslapį Duomenų>lentelės . Pasirinkite duomenų šaltinis lentelę ir patikrinkite schemą.

Deltos ežero kelionės laiku ir duomenų atnaujinimas

Kelionė laiku Deltos ežere yra galimybė pateikti užklausą per lentelės versijas pagal laiko žymą arba versijos numerį. Delta aplankų keitimai yra sukurti ir naudoja delta aplankų versijas, kad galėtų sekti, Customer Insights - Data kokius duomenis apdoroti. Reguliariai atnaujinant delta lentelę, duomenys paimami iš visų duomenų lentelės versijų nuo paskutinio atnaujinimo. Kol yra visos versijos, Customer Insights - Data gali apdoroti tik pakeistus elementus ir pateikti greitesnius rezultatus. Sužinokite daugiau apie keliones laiku.

Pavyzdžiui, jei "Customer Insights" – duomenys paskutinį kartą sinchronizuoti su jūsų delta aplanko duomenų 23 versija, tikimasi rasti 23 versiją ir galbūt vėlesnes galimas versijas. Jei numatomos duomenų versijos nepasiekiamos, duomenų sinchronizavimas nepavyksta ir reikia rankiniu būdu atnaujinti visus duomenis. Duomenų sinchronizavimas gali nepavykti, jei aplanko "Delta" duomenys buvo panaikinti ir sukurti iš naujo. Arba, jei Customer Insights - Data ilgą laiką nepavyko prisijungti prie delta aplankų, kol versijos buvo patobulintos.

Kad nereikėtų atnaujinti visų duomenų, rekomenduojame išlaikyti pagrįstą istorijos atsilikimą, pvz., 15 dienų.

Neautomatinis visų duomenų atnaujinimo paleidimas delta lentelės aplanke

Visiškas atnaujinimas paima visus duomenis iš lentelės delta formatu ir iš naujo įkelia juos iš Delta lentelės versijos nulis (0). Delta aplanko schemos pakeitimai suaktyvina automatinį visišką atnaujinimą. Norėdami rankiniu būdu suaktyvinti visą atnaujinimą, atlikite šiuos veiksmus.

  1. Eikite į Duomenų>šaltiniai.

  2. Pasirinkite "Azure Data Lake Delta" lenteles duomenų šaltinis.

  3. Pasirinkite lentelę, kurią norite atnaujinti. Rodoma sritis Redaguoti lentelę .

    Redaguokite lentelės sritį, kad pasirinktumėte vienkartinį visišką atnaujinimą.

  4. Pasirinkite Vykdyti vienkartinį pilną atnaujinimą.

  5. Pasirinkite Įrašyti , kad paleistumėte atnaujinimą. Atidaromas puslapis Duomenų šaltiniai , kuriame duomenų šaltinis rodoma atnaujinimo būsenoje, bet atnaujinama tik pasirinkta lentelė.

  6. Pakartokite procesą su kitomis lentelėmis, jei taikoma.

Duomenų sinchronizavimo klaida

Duomenų sinchronizavimas gali nepavykti, jei aplanko "Delta" duomenys buvo panaikinti ir sukurti iš naujo. Arba, jei Customer Insights - Data ilgą laiką nepavyko prisijungti prie delta aplankų, kol versijos buvo patobulintos. Norėdami sumažinti poveikį, kai dėl nutrūkstančio duomenų srauto gedimo reikia visiškai atnaujinti, rekomenduojame išlaikyti pagrįstą istorijos atsilikimą, pvz., 15 dienų.

Paskesni veiksmai