Mengelola pustaka Python di Microsoft Fabric
Pustaka menyediakan kode yang dapat digunakan kembali yang mungkin ingin Anda sertakan dalam program atau proyek Anda. Setiap ruang kerja dilengkapi dengan sekumpulan pustaka yang telah diinstal sebelumnya yang tersedia dalam run-time Spark dan tersedia untuk digunakan segera dalam definisi kerja notebook atau Spark. Kami menyebutnya sebagai pustaka bawaan. Namun, Anda mungkin menemukan bahwa Anda perlu menyertakan pustaka tambahan untuk skenario pembelajaran mesin Anda. Dokumen ini menjelaskan bagaimana Anda dapat menggunakan Microsoft Fabric untuk menginstal pustaka Python untuk alur kerja ilmu data Anda.
Pustaka Python di Microsoft Fabric
Dalam Fabric, ada 2 metode untuk menambahkan pustaka Python tambahan.
Pustaka umpan: Pustaka umpan mengacu pada pustaka yang berada di sumber atau repositori publik. Saat ini kami mendukung pustaka umpan Python dari PyPI dan Conda, seseorang dapat menentukan sumbernya di portal Manajemen Pustaka.
Pustaka kustom: Pustaka kustom adalah kode yang dibuat oleh Anda atau organisasi Anda. .whl dan .jar dapat dikelola melalui portal Manajemen Pustaka.
Anda dapat mempelajari selengkapnya tentang umpan dan pustaka kustom dengan masuk ke kelola pustaka dalam dokumentasi Fabric.
Menginstal pustaka ruang kerja
Pustaka tingkat ruang kerja memungkinkan ilmuwan data untuk menstandarkan kumpulan pustaka dan versi di semua pengguna di ruang kerja mereka. Pengaturan pustaka ruang kerja menentukan lingkungan kerja untuk seluruh ruang kerja. Pustaka yang diinstal pada tingkat ruang kerja tersedia untuk semua notebook dan definisi kerja Spark di bawah ruang kerja tersebut. Karena pustaka ini tersedia di seluruh sesi, yang terbaik adalah menggunakan pustaka ruang kerja saat Anda ingin menyiapkan lingkungan bersama untuk semua sesi di ruang kerja.
Penting
Hanya admin Ruang Kerja yang memiliki akses untuk memperbarui pengaturan tingkat Ruang Kerja.
Anda dapat menggunakan pengaturan ruang kerja untuk menginstal umpan Python dan pustaka kustom. Untuk mempelajari lebih lanjut, Anda dapat mengunjungi mengelola pustaka di Fabric.
Menggunakan pengaturan ruang kerja untuk mengelola pustaka umpan
Dalam beberapa kasus, Anda mungkin ingin menginstal pustaka umpan Python tertentu sebelumnya dari PyPI atau Conda di semua sesi buku catatan Anda. Untuk melakukan ini, Anda dapat menavigasi ke ruang kerja Anda dan mengelola pustaka ini melalui pengaturan ruang kerja Python.
Dari pengaturan Ruang Kerja, Anda bisa melakukan hal berikut:
- Lihat dan cari pustaka umpan: Daftar pustaka yang diinstal muncul saat Anda membuka panel manajemen pustaka. Dari tampilan ini, Anda dapat melihat nama pustaka, versi, dan dependensi terkait. Anda juga dapat mencari untuk menemukan pustaka dengan cepat dari daftar ini.
- Menambahkan pustaka umpan baru: Anda dapat menambahkan pustaka umpan Python baru dari PyPI atau Conda. Setelah sumber penginstalan dipilih, Anda dapat memilih tombol + dan baris baru muncul. Untuk menambahkan pustaka, Anda perlu memberikan nama pustaka dan, secara opsional, tentukan eversion ke di baris berikutnya. Untuk mengunggah daftar pustaka secara bersamaan, Anda dapat mengunggah file yang
.yml
berisi dependensi yang diperlukan.
Menggunakan pengaturan ruang kerja untuk mengelola pustaka kustom
Dengan menggunakan pengaturan Ruang Kerja, Anda juga bisa membuat file Python .whl
kustom tersedia untuk semua buku catatan di ruang kerja Anda. Setelah perubahan disimpan, Fabric akan menginstal pustaka kustom Anda dan dependensi terkaitnya.
Penginstalan dalam baris
Saat mengembangkan model pembelajaran mesin atau melakukan analisis data ad-hoc, Anda mungkin perlu menginstal pustaka dengan cepat untuk sesi Apache Spark Anda. Untuk melakukan ini, Anda dapat menggunakan kemampuan penginstalan sebaris untuk memulai pustaka baru dengan cepat.
Catatan
Penginstalan dalam baris hanya memengaruhi sesi buku catatan saat ini. Ini berarti sesi baru tidak akan menyertakan paket yang diinstal di sesi sebelumnya.
Sebaiknya tempatkan semua perintah sebaris yang menambahkan, menghapus, atau memperbarui paket Python di sel pertama Notebook Anda. Perubahan paket Python akan efektif setelah Anda memulai ulang interpreter Python. Variabel yang ditentukan sebelum menjalankan sel perintah akan hilang.
Menginstal pustaka umpan Python dalam buku catatan
%pip
Perintah di Microsoft Fabric setara dengan perintah pip yang umum digunakan di banyak alur kerja ilmu data. Bagian berikut ini memperlihatkan contoh bagaimana Anda bisa menggunakan %pip
perintah untuk menginstal pustaka umpan langsung ke buku catatan Anda.
Jalankan perintah berikut dalam sel kode Notebook untuk menginstal pustaka altair dan vega_datasets:
%conda install altair # install latest version through conda command %conda install vega_datasets # install latest version through conda command
Log dalam output sel menunjukkan hasil penginstalan.
Impor paket dan himpunan data dengan menjalankan kode berikut di sel Notebook lain:
import altair as alt from vega_datasets import data
Catatan
Ketika menginstal pustaka Python baru, perintah %conda install biasanya membutuhkan lebih banyak waktu daripada %pip install karena akan memeriksa dependensi lengkap untuk mendeteksi konflik. Anda mungkin ingin menggunakan penginstalan %conda ketika Anda ingin menghindari potensi masalah. Gunakan penginstalan %pip ketika Anda yakin tentang pustaka yang coba Anda instal tidak bertentangan dengan pustaka yang telah diinstal sebelumnya di lingkungan runtime.
Tip
Semua perintah in-line Python yang tersedia dan klarifikasinya dapat ditemukan: %pip commands dan %conda commands
Mengelola pustaka Python kustom melalui penginstalan in-line
Dalam beberapa kasus, Anda mungkin memiliki pustaka kustom yang ingin Anda instal dengan cepat untuk sesi buku catatan. Untuk melakukan ini, Anda dapat mengunggah pustaka Python kustom Anda ke folder File Lakehouse yang dilampirkan buku catatan Anda.
Untuk melakukan ini:
Navigasi ke Lakehouse Anda dan pilih ... pada folder File .
Kemudian, unggah Python
jar
atauwheel
pustaka kustom Anda.Setelah mengunggah file, Anda bisa menggunakan perintah berikut untuk menginstal pustaka kustom ke sesi buku catatan Anda:
# install the .whl through pip command %pip install /lakehouse/default/Files/wheel_file_name.whl
Langkah berikutnya
- Mengelola pengaturan ruang kerja: Pengaturan administrasi ruang kerja Apache Spark
- Mengelola pustaka di Fabric: Mengelola pustaka dalam dokumentasi Fabric