Bagikan melalui


Membuat buku catatan berparameter dengan menggunakan Papermill

Parameterisasi di Azure Data Studio menjalankan notebook yang sama dengan sekumpulan parameter yang berbeda.

Artikel ini memperlihatkan kepada Anda cara membuat dan menjalankan notebook berparameter di Azure Data Studio dengan menggunakan kernel Python.

Catatan

Saat ini, Anda dapat menggunakan parameterisasi dengan kernel Python, PySpark, PowerShell, dan .NET Interactive.

Prasyarat

Menginstal dan menyiapkan Papermill di Azure Data Studio

Semua langkah di bagian ini berjalan di dalam buku catatan Azure Data Studio.

  1. Buat notebook baru. Ubah Kernel menjadi Python 3:

    Screenshot that shows the New notebook menu option and setting the Kernel value to Python 3.

  2. Jika Anda diminta untuk meningkatkan paket Python saat paket Anda perlu diperbarui, pilih Ya:

    Screenshot that shows the dialog prompt to update Python packages.

  3. Pasang Papermill:

    import sys
    !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
    

    Verifikasi bahwa Papermill diinstal:

    import sys
    !{sys.executable} -m pip list
    

    Screenshot that shows selecting Papermill in a list of application names.

  4. Untuk memverifikasi bahwa Papermill diinstal dengan benar, periksa versi Papermill:

    import papermill
    papermill
    

    Screenshot that shows installation validation for Papermill.

Contoh parameterisasi

Anda bisa menggunakan contoh file buku catatan untuk menelusuri langkah-langkah dalam artikel ini:

  1. Buka file buku catatan di GitHub. Pilih Mentah.
  2. Pilih Ctrl+S atau klik kanan, lalu simpan file dengan ekstensi .ipynb.
  3. Buka file di Azure Data Studio.

Menyiapkan buku catatan berparameter

Anda bisa memulai dengan contoh buku catatan yang terbuka di Azure Data Studio atau menyelesaikan langkah-langkah berikut untuk membuat buku catatan. Kemudian, coba gunakan parameter yang berbeda. Semua langkah berjalan di dalam buku catatan Azure Data Studio.

  1. Verifikasi bahwa Kernel diatur ke Python 3:

    Screenshot that shows the Kernel value to Python 3.

  2. Buat sel kode baru. Pilih Parameter untuk menandai sel sebagai sel parameter.

    x = 2.0
    y = 5.0
    

    Screenshot that shows creating a new parameters cell with Parameters selected.

  3. Tambahkan sel lain untuk menguji parameter yang berbeda:

    addition = x + y
    multiply = x * y
    
    print("Addition: " + str(addition))
    print("Multiplication: " + str(multiply))
    

    Setelah semua sel dijalankan, output akan terlihat mirip dengan contoh ini:

    Screenshot that shows the output of cells added to test new parameters.

  4. Simpan buku catatan sebagai Input.ipynb:

    Screenshot that shows saving the notebook file.

Menjalankan notebook Papermill

Anda dapat menjalankan Papermill dengan dua cara:

  • Antarmuka tingkat panggilan (CLI)
  • Python API

Eksekusi CLI berparameter

Untuk menjalankan buku catatan dengan menggunakan CLI, di terminal, masukkan papermill perintah dengan buku catatan input, lokasi untuk buku catatan output, dan opsi.

Catatan

Untuk mempelajari lebih lanjut , lihat dokumentasi Papermill CLI.

  1. Jalankan buku catatan input dengan parameter baru:

    papermill Input.ipynb Output.ipynb -p x 10 -p y 20
    

    Perintah ini menjalankan buku catatan input dengan nilai baru untuk parameter x dan y.

  2. Sel baru berlabel # Injected-Parameters berisi nilai parameter baru yang diteruskan melalui CLI. Nilai baru # Injected-Parameters digunakan untuk output baru yang diperlihatkan di sel terakhir:

    Screenshot that shows the output for new parameters.

Eksekusi API Python Berparameter

Catatan

Untuk mempelajari lebih lanjut , lihat dokumentasi Papermill Python.

  1. Buat notebook baru. Ubah Kernel menjadi Python 3:

    Screenshot that shows the New notebook menu option and setting the Kernel value to Python 3.

  2. Tambahkan sel kode baru. Kemudian, gunakan Papermill Python API untuk menjalankan dan menghasilkan notebook parameter output:

    import papermill as pm
    
    pm.execute_notebook(
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb',
    '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb',
    parameters = dict(x = 10, y = 20)
    )
    

    Screenshot that shows the Python API execution.

  3. Sel baru berlabel # Injected-Parameters berisi nilai parameter baru yang diteruskan. Nilai baru # Injected-Parameters digunakan untuk output baru yang diperlihatkan di sel terakhir:

    Screenshot that shows the output for new parameters.

Langkah berikutnya

Pelajari selengkapnya tentang buku catatan dan parameterisasi: