Mengotomatiskan proses manajemen pustaka melalui cmdlet Azure PowerShell dan REST API
Anda mungkin ingin mengelola pustaka untuk kumpulan Apache Spark tanpa server tanpa masuk ke halaman antarmuka pengguna Synapse Analytics. Misalnya, Anda mungkin menemukan bahwa:
- Anda mengembangkan paket kustom dan ingin mengunggahnya ke ruang kerja serta menggunakannya di kumpulan Spark. Dan Anda ingin menyelesaikan langkah-langkah pada alat lokal Anda tanpa mengunjungi antarmuka pengguna manajemen paket.
- Anda memperbarui paket Anda melalui proses CI/CD
Dalam artikel ini, kami akan memberikan panduan umum untuk membantu Anda mengelola pustaka melalui cmdlet Azure PowerShell atau REST API.
Mengelola paket melalui cmdlet Azure PowerShell
Menambahkan pustaka baru
Perintah New-AzSynapseWorkspacePackage dapat digunakan untuk mengunggah pustaka baru ke ruang kerja.
New-AzSynapseWorkspacePackage -WorkspaceName ContosoWorkspace -Package ".\ContosoPackage.whl"
Kombinasi perintah New-AzSynapseWorkspacePackage dan Update-AzSynapseSparkPool dapat digunakan untuk mengunggah pustaka baru ke ruang kerja dan melampirkan pustaka ke kumpulan Spark.
$package = New-AzSynapseWorkspacePackage -WorkspaceName ContosoWorkspace -Package ".\ContosoPackage.whl" Update-AzSynapseSparkPool -WorkspaceName ContosoWorkspace -Name ContosoSparkPool -PackageAction Add -Package $package
Jika Anda ingin melampirkan pustaka ruang kerja yang ada ke kumpulan Spark Anda, silakan lihat kombinasi perintah Get-AzSynapseWorkspacePackage dan Update-AzSynapseSparkPool.
$packages = Get-AzSynapseWorkspacePackage -WorkspaceName ContosoWorkspace Update-AzSynapseSparkPool -WorkspaceName ContosoWorkspace -Name ContosoSparkPool -PackageAction Add -Package $packages
Menghapus pustaka
Untuk menghapus paket terinstal dari kumpulan Spark Anda, silakan lihat kombinasi perintah Get-AzSynapseWorkspacePackage dan Update-AzSynapseSparkPool.
$package = Get-AzSynapseWorkspacePackage -WorkspaceName ContosoWorkspace -Name ContosoPackage Update-AzSynapseSparkPool -WorkspaceName ContosoWorkspace -Name ContosoSparkPool -PackageAction Remove -Package $package
Anda juga dapat mengambil kumpulan Spark dan menghapus semua pustaka ruang kerja terlampir dari kumpulan dengan memanggil perintah Get-AzSynapseSparkPool dan Update-AzSynapseSparkPool.
$pool = Get-AzSynapseSparkPool -ResourceGroupName ContosoResourceGroup -WorkspaceName ContosoWorkspace -Name ContosoSparkPool $pool | Update-AzSynapseSparkPool -PackageAction Remove -Package $pool.WorkspacePackages
Untuk kemampuan cmdlet Azure PowerShell lainnya, lihat cmdlet Azure PowerShell untuk Azure Synapse Analytics.
Mengelola paket melalui REST API
Mengelola paket ruang kerja
Dengan kemampuan REST API, Anda dapat menambahkan/menghapus paket atau mencantumkan semua file yang diunggah dari ruang kerja Anda. Lihat API yang didukung penuh, silakan lihat Ringkasan API pustaka ruang kerja.
Mengelola paket kumpulan Spark
Anda dapat memanfaatkan REST API kumpulan Spark untuk melampirkan atau menghapus pustaka sumber terbuka atau kustom ke kumpulan Spark Anda.
Untuk pustaka kustom, tentukan daftar file kustom sebagai properti customLibraries dalam isi permintaan.
"customLibraries": [ { "name": "samplejartestfile.jar", "path": "<workspace-name>/libraries/<jar-name>.jar", "containerName": "prep", "uploadedTimestamp": "1970-01-01T00:00:00Z", "type": "jar" } ]
Anda juga dapat memperbarui pustaka kumpulan Spark dengan menentukan properti libraryRequirements di isi permintaan.
"libraryRequirements": { "content": "", "filename": "requirements.txt" }
Langkah berikutnya
- Lihat pustaka default: dukungan versi Apache Spark
- Mengelola paket tingkat kumpulan Spark melalui portal Studio Synapse: Manajemen paket Python pada Sesi Notebook