Klona en Git-lagringsplats & andra vanliga Git-åtgärder

Artikeln beskriver hur du klonar en Git-lagringsplats och utför andra vanliga Git-åtgärder med Databricks Repos.

Viktigt

Om du klonar en lagringsplats med hjälp av CLI via ett klusters webbterminal visas inte filerna i Azure Databricks-användargränssnittet.

Lägga till en lagringsplats och ansluta via fjärranslutning senare

Du kan också skapa en ny lagringsplats i Azure Databricks och lägga till url:en för git-fjärrlagringsplatsen senare.

  1. Om du vill skapa en ny lagringsplats som inte är länkad till en fjärransluten Git-lagringsplats klickar du på knappen Lägg till lagringsplats . Avmarkera Skapa lagringsplats genom att klona en Git-lagringsplats, ange ett namn för lagringsplatsen och klicka sedan på Skapa lagringsplats.

    Lägg till lagringsplats utan att fjärransluta.

  2. När du är redo att lägga till Git-lagringsplatsens URL klickar du på nedåtpilen bredvid lagringsplatsens namn på arbetsytan för att öppna lagringsplatsens meny och väljer Git... för att öppna Git-dialogrutan.

    Lagringsplatsmeny: Lägg till en Git-lagringsplats-URL.

  3. I fältet Url för Git-lagringsplats anger du URL:en för fjärrlagringsplatsen och väljer git-providern i den nedrullningsbara menyn. Klicka på Spara.

    Fliken Inställningar för Git-dialogruta.

Lägga till en lagringsplats som är ansluten till en fjärrdatabas

  1. Klicka på Repos IconRepos (Lagringsplatser ) i sidofältet.

  2. Klicka på Lägg till lagringsplats.

    Lägg till lagringsplats.

  3. I dialogrutan Lägg till lagringsplats väljer du Skapa lagringsplats genom att klona en Git-lagringsplats och ange lagringsplatsens URL. Välj git-providern i den nedrullningsbara menyn, ändra namnet som ska användas för Databricks-lagringsplatsen och klicka på Skapa lagringsplats. Innehållet i fjärrlagringsplatsen klonas till Databricks-lagringsplatsen.

    Klona från lagringsplatsen.

I det här skedet har du möjlighet att endast klona en delmängd av lagringsplatsernas kataloger via Sparse Checkout-läget se sparse-kassan. Detta är särskilt användbart om lagringsplatsens storlek ligger utanför de databricks-gränser som stöds

Öppna Git-dialogrutan

Du kan komma åt Git-dialogrutan från en notebook-fil eller från webbläsaren Databricks Repos.

  • Från en anteckningsbok klickar du på knappen bredvid namnet på anteckningsboken som identifierar den aktuella Git-grenen.

    Git-dialogruta i notebook-filen.

  • I webbläsaren Databricks Repos klickar du på knappen till höger om lagringsplatsens namn:

    Git-dialogruta i lagringsplatsens webbläsare.

    Du kan också klicka på nedåtpilen bredvid lagringsplatsens namn och välja Git... på menyn.

    Lagringsmenyn: Öppna Git-dialogrutan.

Hämta ändringar från git-fjärrlagringsplatsen

Om du vill hämta ändringar från git-fjärrlagringsplatsen klickar du på Hämtai Git-dialogrutan. Notebook-filer och andra filer uppdateras automatiskt till den senaste versionen på fjärrlagringsplatsen.

Viktigt

Git-åtgärder som hämtar överordnade ändringar rensar notebook-tillståndet. Mer information finns i Inkommande ändringar rensar notebook-tillståndet.

Lösa sammanslagningskonflikter

För att lösa en sammanslagningskonflikt måste du antingen ignorera ändringar i konflikt eller checka in ändringarna i en ny gren och sedan sammanfoga dem till den ursprungliga funktionsgrenen med hjälp av en pull-begäran.

  1. Om det finns en sammanslagningskonflikt visar användargränssnittet för lagringsplatser ett meddelande som gör att du kan avbryta hämtningen eller lösa konflikten. Om du väljer Lös konflikt med hjälp av PR visas en dialogruta där du kan skapa en ny gren och checka in ändringarna i den.

    Lös en dialogruta för sammanslagningskonflikter.

  2. När du klickar på Checka in till en ny gren visas ett meddelande med en länk: Skapa en pull-begäran för att lösa sammanslagningskonflikter. Klicka på länken för att öppna Git-providern.

    Skapa PR-meddelande för sammanslagningskonflikt.

  3. I Git-providern skapar du PR, löser konflikterna och sammanfogar den nya grenen till den ursprungliga grenen.

  4. Gå tillbaka till användargränssnittet för lagringsplatser. Använd Git-dialogrutan för att hämta ändringar från Git-lagringsplatsen till den ursprungliga grenen.

Checka in och skicka ändringar till git-fjärrlagringsplatsen

När du har lagt till nya anteckningsböcker eller filer, eller gjort ändringar i befintliga notebook-filer, markerar Git-dialogrutan ändringarna.

Git-dialogruta.

Lägg till en obligatorisk sammanfattning av ändringarna och klicka på Checka in & push för att skicka ändringarna till git-fjärrlagringsplatsen.

Om du inte har behörighet att checka in till standardgrenen, till exempel main, skapar du en ny gren och använder git-providergränssnittet för att skapa en pull-begäran (PR) för att sammanfoga den till standardgrenen.

Anteckning

  • Resultaten ingår inte i en notebook-incheckning. Alla resultat rensas innan incheckningen görs.
  • Anvisningar om hur du löser sammanslagningskonflikter finns i Lösa sammanslagningskonflikter.

Växla till en annan gren

Du kan växla till (kassan) en annan gren via listrutan gren i Git-dialogrutan

Skapa en ny gren

Du kan skapa en ny gren baserat på en befintlig gren från Git-dialogrutan:

Git dialogruta ny gren.

Git-återställning

Viktigt

Den här funktionen finns som allmänt tillgänglig förhandsversion.

I Databricks Repos kan du utföra en Git reset i Azure Databricks-användargränssnittet. Git-återställning i Databricks Repos motsvarar en git reset --hard åtgärd. Ändringar som görs i din lokala gren skickas också till fjärranslutning.

Med Git-återställning kan du återställa en gren till ett känt bra tillstånd. Du kan använda detta när de lokala redigeringarna står i konflikt med den överordnade grenen och du inte har något emot att förlora dessa redigeringar. Läs mer om git reset –hard.

Återställ till den överordnade grenen (fjärransluten)

Följ dessa steg om du vill återställa den lokala grenen till fjärrgrenen.

Anteckning

När du återställer förlorar du alla icke-obligatoriska ändringar, mellanlagrade och otaglade.

  1. Välj Återställ från kebabmenyn.

  2. Välj den gren som ska återställas.

    Git-återställning – hård dialogruta

Återställa till en annan fjärrgren

I det här scenariot återställer du den valda grenen (till exempel feature_a) till en annan gren (till exempel main). Den här processen återställer också den överordnade grenen (fjärrgrenen) till huvudgrenen feature_a .

Viktigt

  • Om du har icke-bakåtkompatibla ändringar varnar en avisering om att "Dina ogenomförda ändringar kommer att gå förlorade".
  • Om du återställer till en annan gren kör Azure Databricks en force push-åtgärd som återställer historiken för din aktuella gren på en fjärranslutning.
  1. Välj Återställ från kebabmenyn.

  2. Välj den fjärrgren som du vill återställa till. I det här exemplet återställer du till grenen main .

    Git-återställning – hård till en annan grendialogruta

Konfigurera sparse-utcheckningsläge

Sparse-utcheckning är en inställning på klientsidan som gör att du kan klona och arbeta med endast en delmängd av fjärrlagringsplatsernas kataloger i Databricks. Detta är särskilt användbart om lagringsplatsens storlek ligger utanför de databricks-gränser som stöds.

Du kan använda Sparse Checkout-läget när du lägger till (klonar) en ny lagringsplats.

  1. Öppna Avancerat i dialogrutan Lägg till lagringsplats.

  2. Välj Sparse-utcheckningsläge.

    Glesa utcheckningsalternativ i dialogrutan Lägg till lagringsplats.

  3. I rutan Cone patterns (Konmönster ) anger du de konutcheckningsmönster som du vill använda. Avgränsa flera mönster med radbrytningar.

För närvarande kan du inte inaktivera gles utcheckning för en lagringsplats i Azure Databricks.

Så här fungerar konmönster

Information om hur konmönstret fungerar i utcheckningsläget för glesa datorer finns i följande diagram som representerar strukturen för fjärrlagringsplatsen.

Fjärrlagringsplatsstruktur utan sparse-utcheckning.

Om du väljer Sparse-utcheckningsläge, men inte anger ett konmönster, tillämpas standardkonmönstret. Detta inkluderar endast filerna i roten och inga underkataloger, vilket resulterar i en lagringsplatsstruktur enligt följande:

Sparse checkout: standardkonmönster.

Om du anger mönstret parent/child/grandchild för den glesa utcheckningen inkluderas allt innehåll grandchild i katalogen rekursivt. Filerna direkt i - och -rotkatalogen /parent/parent/child ingår också. Se katalogstrukturen i följande diagram:

Sparse-utcheckning: Ange konmönstret parent-grandchild-child folder.

Du kan lägga till flera mönster avgränsade med radbrytningar.

Ändra inställningar för sparse-utcheckning

När en lagringsplats har skapats kan det glesa utcheckningskonmönstret redigeras från Inställningar > Avancerade > konmönster.

Observera följande:

  • Om du tar bort en mapp från konmönstret tas den bort från Databricks om det inte finns några ogenomförda ändringar.

  • Om du lägger till en mapp via redigering av det glesa utcheckningskonmönstret läggs den till i Databricks utan ytterligare hämtning.

  • Glesa utcheckningsmönster kan inte ändras för att ta bort en mapp när det finns ogenomförda ändringar i mappen.

    En användare redigerar till exempel en fil i en mapp och genomför inte ändringar. Hon försöker sedan ändra det glesa utcheckningsmönstret så att det inte innehåller den här mappen. I det här fallet accepteras mönstret, men den faktiska mappen tas inte bort. Hon måste återställa mönstret för att inkludera mappen, checka in ändringar och sedan tillämpa det nya mönstret igen.

Anteckning

Du kan inte inaktivera sparse-utcheckning för en lagringsplats som skapades med Sparse Checkout-läget aktiverat.

Göra och push-överföra ändringar med gles utcheckning aktiverat

Du kan redigera befintliga filer och checka in och push-överföra dem från lagringsplatsgränssnittet. När du skapar nya mappar med filer bör du se till att de ingår i det konmönster som du har angett för lagringsplatsen.

Om du inkluderar en ny mapp utanför konmönstret uppstår ett fel under inchecknings- och push-åtgärden. Om du vill åtgärda det redigerar du konmönstret så att det innehåller den nya mappen som du försöker checka in och push-överföra.

Använda lagringsplats-API:et

Med API:et för lagringsplatser kan du skapa, lista, uppdatera och ta bort Databricks Repos programmatiskt. Dessutom kan du använda API:et för Git-autentiseringsuppgifter för att hantera git-provider-PAT:er.