Dela via


Uppdatera en Common Data Model-datakälla för att använda Delta-tabeller

Uppdatera en befintlig dataanslutning med tabellerna i Common Data Model och gå till Delta-formaterade tabeller utan att ta bort och skapa en befintlig konfiguration som är beroende av dataanslutningen.

Viktiga orsaker till att ansluta till data som är lagrade i Delta-format:

  • Importera Delta-formaterade data direkt för att spara tid och arbete.
  • Eliminera beräknings- och lagringskostnaderna för att omvandla och lagra en kopia av dina lakehouse-data.
  • Automatiskt förbättra tillförlitligheten för datainmatning till Customer Insights - Data som tillhandahålls av Delta-versionshantering.

Delta är en term som introduceras med Delta Lake, grunden för att lagra data och tabeller i Databricks Lakehouse-plattformen. Delta Lake är ett lagringslager med öppen källkod som för ACID-transaktioner (atomicitet, konsistens, isolering och hållbarhet) till big data-arbetsbelastningar. Mer information finns på sidan Delta Lake-dokumentation.

Förutsättningar

  • Azure Data Lake Storage måste finnas i samma klientorganisation och Azure-region som Customer Insights - Data.

  • Customer Insights - Data huvudkonto för tjänsten måste ha behörighet till Storage Blob-datadeltagare för åtkomst lagringskonto. Mer information finns i Bevilja behörigheter till tjänstens huvudnamn för åtkomst till lagringskontot.

  • Användaren som konfigurerar eller uppdaterar datakällanslutningen behöver minst behörigheten Storage Blob dataläsare på Azure Data Lake Storage-kontot.

  • Data som lagras i onlinetjänster kan lagras på en annan plats än där data behandlas eller lagras. Genom att importera eller ansluta till data som lagras på en onlinetjänst, t.ex. godkänner du att data kan överföras.  Läs mer i Microsoft Trust Center.

  • Customer Insights - Data har stöd för Databricks läsare version 2. Delta-tabeller med funktioner som kräver Databricks läsare version 3 eller senare stöds inte. Mer information: Hur hanterar Databricks Delta Lake-funktionens kompatibilitet?

  • Delta-tabellerna måste finnas i en mapp i lagringsbehållaren och kan inte finnas i behållarens rotkatalog. Till exempel:

    storageaccountcontainer/
        DeltaDataRoot/
           ADeltaTable/
                 _delta_log/
                     0000.json
                     0001.json
                 part-0001-snappy.parquet
                 part-0002-snappy.parquet
    
  • Delta-tabellerna och deras schema måste matcha tabellerna i den befintliga Common Data Model-datakällan och vara i samma lagringsbehållare. Tabellerna i den nya datamappen måste matcha exakt med de valda tabellerna i Common Data Model-datakälla. Tabellernas namn och deras scheman måste matcha exakt. I Delta är tabellnamnen desamma som mappnamnet där data lagras. Därför måste mappnamn måste matcha exakt med de valda tabellerna i Common Data Model-datakälla. Annars kan uppdateringen misslyckas.

    Till exempel, om de valda tabellerna för Common Data Model-datakällan är Tabell1 och Tabell2, måste mappen du väljer för uppdateringen visa Tabell1 och Tabell2 i hierarkin.

    storageaccountroot/
    DeltaDataRoot/
        Table1/
        Table2/
    

Uppdatera Common Data Model-datatabeller till Delta-tabeller

  1. Gå till Data>Datakällor.

  2. Välj Azure Data Lake Common Data Model-datakälla och välj sedan Uppdatering till Delta-tabeller. Eller välj Börja uppdatera från sidan Lägg till tabeller om du redigerar Common Data Model-datakälla.

    Sidan Datakällor som visar en Common Data Model-datakälla där Uppdaterat till Delta-tabeller har markerats.

  3. Välj Bläddra och navigera till mappen som innehåller data i Delta-format och stämmer exakt den valda Azure Data Lake datakälla-tabellen. Välj den och välj sedan Uppdatera datakälla.

    Sidan Datakällor öppnas där den nya datakälla visas i status uppdateras.

    Viktigt

    Stoppa inte uppdateringsprocessen eftersom det kan påverka uppdateringen av datakälla negativt.

    Dricks

    Det finns statusar för uppgifter och processer. De flesta processer är beroende av andra processförlopp, t.ex. datakällor och uppdateringar av dataprofiler.

    Välj status för att öppna rutan Förloppsinformation och se framstegen för uppgifter. Om du vill avbryta jobbet väljer du Avbryt jobbet längst ned i fönstret.

    Under varje uppgift kan du välja Visa information om du vill ha mer förloppsinformation, till exempel bearbetningstid, senaste bearbetningsdatum och eventuella tillämpliga fel och varningar för uppgiften eller processen. Välj Visa systemstatus längst ned i panelen om du vill se andra processer i systemet.

Vi rekommenderar att du fortsätter att strömma dina data till Data Lake Storage-platsen genom din befintliga pipeline och underhåller manifest och scheman tills du fastställer att uppdateringen lyckades och allt fungerar som förväntat.

Återställ konverteringen från Common Data Model-tabeller till Delta-tabeller

Om du försökte uppdatera en Azure Data Lake Common Data Model-datakälla till Delta-tabeller och processen misslyckas, utför följande steg.

Förutsättningar

  • Din organisation har fortsatt att strömma Data Lake Storage-data genom din pipeline.
  • Din organisation har underhållit Data Lake Storage-manifest och -scheman.

Återgå till en Azure Data Lake Common Data Model-datakälla

  1. Gå till Data>Datakällor.

  2. Välj Azure Data Lake Common Data Model-datakälla och välj sedan Återgår till Common Data Model-tabeller.

  3. Bekräfta att du vill återställa. Sidan Datakällor öppnas där den nya datakälla visas i status uppdateras.

    Viktigt

    Stoppa inte uppdateringsprocessen eftersom det kan påverka återställningen av datakälla negativt.