Dela via


Skapa en parametriserad notebook-fil med hjälp av Papermill

Parameterisering i Azure Data Studio kör samma notebook-fil med en annan uppsättning parametrar.

Den här artikeln visar hur du skapar och kör en parametriserad notebook-fil i Azure Data Studio med hjälp av Python-kerneln.

Kommentar

För närvarande kan du använda parameterisering med Python, PySpark, PowerShell och .NET Interaktiva kernels.

Förutsättningar

Installera och konfigurera Papermill i Azure Data Studio

Alla steg i det här avsnittet körs i en Azure Data Studio-anteckningsbok.

  1. Skapa en ny anteckningsbok. Ändra Kernel till Python 3:

    Skärmbild som visar menyalternativet Ny anteckningsbok och anger kernelvärdet till Python 3.

  2. Om du uppmanas att uppgradera dina Python-paket när paketen behöver uppdateras väljer du Ja:

    Skärmbild som visar dialogrutan för att uppdatera Python-paket.

  3. Installera Papermill:

    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Kontrollera att Papermill är installerat:

    import sys
    !{sys.executable} -m pip list
    

    Skärmbild som visar hur du väljer Papermill i en lista med programnamn.

  4. Kontrollera att Papermill har installerats korrekt genom att kontrollera versionen av Papermill:

    import papermill
    papermill
    

    Skärmbild som visar installationsverifiering för Papermill.

Exempel på parameterisering

Du kan använda en notebook-exempelfil för att gå igenom stegen i den här artikeln:

  1. Gå till notebook-filen i GitHub. Välj .
  2. Välj Ctrl+S eller högerklicka och spara sedan filen med tillägget .ipynb.
  3. Öppna filen i Azure Data Studio.

Konfigurera en parametriserad notebook-fil

Du kan börja med att öppna exempelanteckningsboken i Azure Data Studio eller utföra följande steg för att skapa en notebook-fil. Försök sedan använda olika parametrar. Alla steg körs i en Azure Data Studio-anteckningsbok.

  1. Kontrollera att Kernel är inställt på Python 3:

    Skärmbild som visar kernelvärdet för Python 3.

  2. Skapa en ny kodcell. Välj Parametrar för att tagga cellen som en parametercell.

    x = 2.0
    y = 5.0
    

    Skärmbild som visar hur du skapar en ny parametercell med Parametrar valda.

  3. Lägg till andra celler för att testa olika parametrar:

    addition = x + y
    multiply = x * y
    
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    När alla celler har körts ser utdata ut ungefär som i det här exemplet:

    Skärmbild som visar utdata från celler som lagts till för att testa nya parametrar.

  4. Spara notebook-filen som Input.ipynb:

    Skärmbild som visar hur du sparar notebook-filen.

Köra en Papermill-anteckningsbok

Du kan köra Papermill på två sätt:

  • Kommandoradsgränssnittet (CLI)
  • Python API

Parameteriserad CLI-körning

Om du vill köra en notebook-fil med hjälp av CLI går du till terminalen papermill och anger kommandot med notebook-filen för indata, platsen för utdataanteckningsboken och alternativen.

Kommentar

Mer information finns i Papermill CLI-dokumentationen.

  1. Kör notebook-filen för indata med nya parametrar:

    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    Det här kommandot kör notebook-filen med nya värden för parametrarna x och y.

  2. En ny cell med etiketten # Injected-Parameters innehåller de nya parametervärdena som skickades in via CLI. De nya # Injected-Parameters värdena används för de nya utdata som visas i den sista cellen:

    Skärmbild som visar utdata för nya parametrar.

Parameteriserad Python API-körning

Kommentar

Mer information finns i Dokumentationen om Papermill Python.

  1. Skapa en ny anteckningsbok. Ändra Kernel till Python 3:

    Skärmbild som visar menyalternativet Ny anteckningsbok och anger kernelvärdet till Python 3.

  2. Lägg till en ny kodcell. Använd sedan Papermill Python-API:et för att köra och generera den utdataparameteriserade notebook-filen:

    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Skärmbild som visar Python API-körningen.

  3. En ny cell med etiketten # Injected-Parameters innehåller de nya parametervärdena som skickades in. De nya # Injected-Parameters värdena används för de nya utdata som visas i den sista cellen:

    Skärmbild som visar utdata för nya parametrar.

Nästa steg

Läs mer om notebook-filer och parameterisering: