Papermill kullanarak parametreli not defteri oluşturma
Azure Data Studio'da parametreleştirme , farklı bir parametre kümesiyle aynı not defterini çalıştırıyor.
Bu makalede, Python çekirdeğini kullanarak Azure Data Studio'da parametreli not defteri oluşturma ve çalıştırma adımları gösterilmektedir.
Not
Şu anda Parametreleştirmeyi Python, PySpark, PowerShell ve .NET Etkileşimli çekirdekleriyle kullanabilirsiniz.
Önkoşullar
Azure Data Studio'da Papermill'i yükleme ve ayarlama
Bu bölümdeki tüm adımlar bir Azure Data Studio not defteri içinde çalıştırılır.
Yeni bir not defteri oluşturun. Çekirdeği Python 3 olarak değiştirin:
Paketlerinizin güncelleştirilmesi gerektiğinde Python paketlerinizi yükseltmeniz istenirse Evet'i seçin:
Papermill'i yükleyin:
import sys !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
Papermill'in yüklü olduğunu doğrulayın:
import sys !{sys.executable} -m pip list
Papermill'in doğru yüklendiğini doğrulamak için Papermill sürümünü denetleyin:
import papermill papermill
Parametreleştirme örneği
Bu makaledeki adımları uygulamak için örnek bir not defteri dosyası kullanabilirsiniz:
- GitHub'da not defteri dosyasına gidin. Ham'ı seçin.
- Ctrl+S tuşlarına basın veya sağ tıklayın ve dosyayı .ipynb uzantısıyla kaydedin.
- Dosyayı Azure Data Studio'da açın.
Parametreli not defteri ayarlama
Örnek not defterinin Azure Data Studio'da açılmasıyla başlayabilir veya not defteri oluşturmak için aşağıdaki adımları tamamlayabilirsiniz. Ardından farklı parametreler kullanmayı deneyin. Tüm adımlar bir Azure Data Studio not defteri içinde çalıştırılır.
Çekirdeğin Python 3 olarak ayarlandığını doğrulayın:
Yeni bir kod hücresi oluşturma. Hücreyi parametre hücresi olarak etiketlemek için Parametreler'i seçin.
x = 2.0 y = 5.0
Farklı parametreleri test etmek için başka hücreler ekleyin:
addition = x + y multiply = x * y
print("Addition: " + str(addition)) print("Multiplication: " + str(multiply))
Tüm hücreler çalıştırıldıktan sonra çıkış şu örneğe benzer olacaktır:
Not defterini Input.ipynb olarak kaydedin:
Papermill not defteri yürütme
Papermill'i iki şekilde yürütebilirsiniz:
- Komut satırı arabirimi (CLI)
- Python API
Parametreli CLI yürütme
CLI kullanarak bir not defteri yürütmek için terminalde giriş not defteri, çıkış not defterinin konumu ve seçenekleri içeren komutu girin papermill
.
Giriş not defterini yeni parametrelerle yürütür:
papermill Input.ipynb Output.ipynb -p x 10 -p y 20
Bu komut, giriş not defterini x ve y parametreleri için yeni değerlerle yürütür.
Etiketli
# Injected-Parameters
yeni bir hücre, CLI aracılığıyla geçirilen yeni parametre değerlerini içerir. Yeni# Injected-Parameters
değerler, son hücrede gösterilen yeni çıkış için kullanılır:
Parametreli Python API'si yürütme
Yeni bir not defteri oluşturun. Çekirdeği Python 3 olarak değiştirin:
Yeni bir kod hücresi ekleyin. Ardından papermill Python API'sini kullanarak çıktı parametreli not defterini yürütün ve oluşturun:
import papermill as pm pm.execute_notebook( '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb', '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb', parameters = dict(x = 10, y = 20) )
Etiketli
# Injected-Parameters
yeni bir hücre, geçirilen yeni parametre değerlerini içerir. Yeni# Injected-Parameters
değerler, son hücrede gösterilen yeni çıkış için kullanılır:
Sonraki adımlar
Not defterleri ve parametreleştirme hakkında daha fazla bilgi edinin: