Skapa en parametriserad notebook-fil med hjälp av Papermill
Parameterisering i Azure Data Studio kör samma notebook-fil med en annan uppsättning parametrar.
Den här artikeln visar hur du skapar och kör en parametriserad notebook-fil i Azure Data Studio med hjälp av Python-kerneln.
Kommentar
För närvarande kan du använda parameterisering med Python, PySpark, PowerShell och .NET Interaktiva kernels.
Förutsättningar
Installera och konfigurera Papermill i Azure Data Studio
Alla steg i det här avsnittet körs i en Azure Data Studio-anteckningsbok.
Skapa en ny anteckningsbok. Ändra Kernel till Python 3:
Om du uppmanas att uppgradera dina Python-paket när paketen behöver uppdateras väljer du Ja:
Installera Papermill:
import sys !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
Kontrollera att Papermill är installerat:
import sys !{sys.executable} -m pip list
Kontrollera att Papermill har installerats korrekt genom att kontrollera versionen av Papermill:
import papermill papermill
Exempel på parameterisering
Du kan använda en notebook-exempelfil för att gå igenom stegen i den här artikeln:
- Gå till notebook-filen i GitHub. Välj Rå.
- Välj Ctrl+S eller högerklicka och spara sedan filen med tillägget .ipynb.
- Öppna filen i Azure Data Studio.
Konfigurera en parametriserad notebook-fil
Du kan börja med att öppna exempelanteckningsboken i Azure Data Studio eller utföra följande steg för att skapa en notebook-fil. Försök sedan använda olika parametrar. Alla steg körs i en Azure Data Studio-anteckningsbok.
Kontrollera att Kernel är inställt på Python 3:
Skapa en ny kodcell. Välj Parametrar för att tagga cellen som en parametercell.
x = 2.0 y = 5.0
Lägg till andra celler för att testa olika parametrar:
addition = x + y multiply = x * y
print("Addition: " + str(addition)) print("Multiplication: " + str(multiply))
När alla celler har körts ser utdata ut ungefär som i det här exemplet:
Spara notebook-filen som Input.ipynb:
Köra en Papermill-anteckningsbok
Du kan köra Papermill på två sätt:
- Kommandoradsgränssnittet (CLI)
- Python API
Parameteriserad CLI-körning
Om du vill köra en notebook-fil med hjälp av CLI går du till terminalen papermill
och anger kommandot med notebook-filen för indata, platsen för utdataanteckningsboken och alternativen.
Kör notebook-filen för indata med nya parametrar:
papermill Input.ipynb Output.ipynb -p x 10 -p y 20
Det här kommandot kör notebook-filen med nya värden för parametrarna x och y.
En ny cell med etiketten
# Injected-Parameters
innehåller de nya parametervärdena som skickades in via CLI. De nya# Injected-Parameters
värdena används för de nya utdata som visas i den sista cellen:
Parameteriserad Python API-körning
Kommentar
Mer information finns i Dokumentationen om Papermill Python.
Skapa en ny anteckningsbok. Ändra Kernel till Python 3:
Lägg till en ny kodcell. Använd sedan Papermill Python-API:et för att köra och generera den utdataparameteriserade notebook-filen:
import papermill as pm pm.execute_notebook( '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb', '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb', parameters = dict(x = 10, y = 20) )
En ny cell med etiketten
# Injected-Parameters
innehåller de nya parametervärdena som skickades in. De nya# Injected-Parameters
värdena används för de nya utdata som visas i den sista cellen:
Nästa steg
Läs mer om notebook-filer och parameterisering: