Aracılığıyla paylaş


Papermill kullanarak parametreli not defteri oluşturma

Azure Data Studio'da parametreleştirme , farklı bir parametre kümesiyle aynı not defterini çalıştırıyor.

Bu makalede, Python çekirdeğini kullanarak Azure Data Studio'da parametreli not defteri oluşturma ve çalıştırma adımları gösterilmektedir.

Not

Şu anda Parametreleştirmeyi Python, PySpark, PowerShell ve .NET Etkileşimli çekirdekleriyle kullanabilirsiniz.

Önkoşullar

Azure Data Studio'da Papermill'i yükleme ve ayarlama

Bu bölümdeki tüm adımlar bir Azure Data Studio not defteri içinde çalıştırılır.

  1. Yeni bir not defteri oluşturun. Çekirdeği Python 3 olarak değiştirin:

    Yeni not defteri menü seçeneğini gösteren ve Çekirdek değerini Python 3 olarak ayarlayan ekran görüntüsü.

  2. Paketlerinizin güncelleştirilmesi gerektiğinde Python paketlerinizi yükseltmeniz istenirse Evet'i seçin:

    Python paketlerini güncelleştirmek için iletişim kutusu istemini gösteren ekran görüntüsü.

  3. Papermill'i yükleyin:

    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Papermill'in yüklü olduğunu doğrulayın:

    import sys
    !{sys.executable} -m pip list
    

    Uygulama adları listesinde Papermill'in seçilmesini gösteren ekran görüntüsü.

  4. Papermill'in doğru yüklendiğini doğrulamak için Papermill sürümünü denetleyin:

    import papermill
    papermill
    

    Papermill için yükleme doğrulamasını gösteren ekran görüntüsü.

Parametreleştirme örneği

Bu makaledeki adımları uygulamak için örnek bir not defteri dosyası kullanabilirsiniz:

  1. GitHub'da not defteri dosyasına gidin. Ham'ı seçin.
  2. Ctrl+S tuşlarına basın veya sağ tıklayın ve dosyayı .ipynb uzantısıyla kaydedin.
  3. Dosyayı Azure Data Studio'da açın.

Parametreli not defteri ayarlama

Örnek not defterinin Azure Data Studio'da açılmasıyla başlayabilir veya not defteri oluşturmak için aşağıdaki adımları tamamlayabilirsiniz. Ardından farklı parametreler kullanmayı deneyin. Tüm adımlar bir Azure Data Studio not defteri içinde çalıştırılır.

  1. Çekirdeğin Python 3 olarak ayarlandığını doğrulayın:

    Python 3 çekirdek değerini gösteren ekran görüntüsü.

  2. Yeni bir kod hücresi oluşturma. Hücreyi parametre hücresi olarak etiketlemek için Parametreler'i seçin.

    x = 2.0
    y = 5.0
    

    Parametreler'in seçili olduğu yeni bir parametre hücresi oluşturmayı gösteren ekran görüntüsü.

  3. Farklı parametreleri test etmek için başka hücreler ekleyin:

    addition = x + y
    multiply = x * y
    
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    Tüm hücreler çalıştırıldıktan sonra çıkış şu örneğe benzer olacaktır:

    Yeni parametreleri test etmek için eklenen hücrelerin çıkışını gösteren ekran görüntüsü.

  4. Not defterini Input.ipynb olarak kaydedin:

    Not defteri dosyasını kaydetmeyi gösteren ekran görüntüsü.

Papermill not defteri yürütme

Papermill'i iki şekilde yürütebilirsiniz:

  • Komut satırı arabirimi (CLI)
  • Python API

Parametreli CLI yürütme

CLI kullanarak bir not defteri yürütmek için terminalde giriş not defteri, çıkış not defterinin konumu ve seçenekleri içeren komutu girin papermill .

Not

Daha fazla bilgi edinmek için Papermill CLI belgelerine bakın.

  1. Giriş not defterini yeni parametrelerle yürütür:

    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    Bu komut, giriş not defterini x ve y parametreleri için yeni değerlerle yürütür.

  2. Etiketli # Injected-Parameters yeni bir hücre, CLI aracılığıyla geçirilen yeni parametre değerlerini içerir. Yeni # Injected-Parameters değerler, son hücrede gösterilen yeni çıkış için kullanılır:

    Yeni parametrelerin çıkışını gösteren ekran görüntüsü.

Parametreli Python API'si yürütme

Not

Daha fazla bilgi edinmek için Papermill Python belgelerine bakın.

  1. Yeni bir not defteri oluşturun. Çekirdeği Python 3 olarak değiştirin:

    Yeni not defteri menü seçeneğini gösteren ve Çekirdek değerini Python 3 olarak ayarlayan ekran görüntüsü.

  2. Yeni bir kod hücresi ekleyin. Ardından papermill Python API'sini kullanarak çıktı parametreli not defterini yürütün ve oluşturun:

    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Python API yürütmesini gösteren ekran görüntüsü.

  3. Etiketli # Injected-Parameters yeni bir hücre, geçirilen yeni parametre değerlerini içerir. Yeni # Injected-Parameters değerler, son hücrede gösterilen yeni çıkış için kullanılır:

    Yeni parametrelerin çıkışını gösteren ekran görüntüsü.

Sonraki adımlar

Not defterleri ve parametreleştirme hakkında daha fazla bilgi edinin: