Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Dalam artikel ini, Anda mempelajari cara menyebarkan model dari katalog model sebagai penyebaran standar.
Model-model tertentu dalam katalog model dapat diimplementasikan sebagai penerapan standar dengan penagihan Standar. Jenis penyebaran ini menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di langganan Anda, sambil mempertahankan keamanan dan kepatuhan perusahaan yang dibutuhkan organisasi. Opsi penyebaran ini tidak memerlukan kuota dari langganan Anda.
Artikel ini menggunakan penyebaran model Meta Llama sebagai ilustrasi. Namun, Anda dapat menggunakan langkah yang sama untuk menyebarkan salah satu model dalam katalog model yang tersedia untuk penyebaran standar.
Prasyarat
Langganan Azure dengan metode pembayaran yang valid. Langganan Azure gratis atau uji coba tidak akan berfungsi. Jika Anda tidak memiliki langganan Azure, buat akun Azure berbayar untuk memulai.
Kontrol akses berbasis peran Azure (Azure RBAC) digunakan untuk memberikan akses ke operasi di Azure Machine Learning. Untuk melakukan langkah-langkah dalam artikel ini, akun pengguna Anda harus diberi peran Pengembang Azure AI pada grup sumber daya. Untuk informasi selengkapnya tentang izin, lihat Kontrol akses berbasis peran di Azure Pembelajaran Mesin.
Anda perlu menginstal perangkat lunak berikut untuk bekerja dengan Azure Pembelajaran Mesin:
Anda dapat menggunakan browser web yang kompatibel untuk menavigasi Azure Pembelajaran Mesin.
Menemukan MODEL dan ID model Anda di katalog model
Masuk ke Studio Azure Machine Learning
Untuk model yang ditawarkan melalui Azure Marketplace, pastikan akun Anda memiliki izin peran Pengembang Azure AI pada grup sumber daya, atau Bahwa Anda memenuhi izin yang diperlukan untuk berlangganan penawaran model.
Model yang ditawarkan oleh penyedia non-Microsoft (misalnya, model Llama dan Mistral) ditagih melalui Marketplace Azure. Untuk model tersebut, Anda diharuskan untuk mendaftarkan ruang kerja Anda pada penawaran model tertentu. Model yang ditawarkan oleh Microsoft (misalnya, model Phi-3) tidak memiliki persyaratan ini, karena penagihan dilakukan secara berbeda. Untuk detail tentang penagihan untuk penyebaran model tanpa server di katalog model, lihat Penagihan untuk penyebaran standar.
Buka ruang kerja Anda. Untuk menggunakan penawaran penyebaran standar, ruang kerja Anda harus termasuk dalam salah satu wilayah yang didukung untuk penyebaran tanpa server untuk model tertentu yang ingin Anda sebarkan.
Pilih Katalog model dari bilah sisi kiri dan temukan kartu model model yang ingin Anda sebarkan. Dalam artikel ini, Anda memilih model Bria-2.3-Fast .
- Jika Anda menyebarkan model menggunakan Azure CLI, Python SDK, atau ARM, salin ID Model.
Penting
Jangan sertakan versi saat menyalin ID Model. Penyebaran standar selalu menyebarkan versi terbaru model yang tersedia. Misalnya, untuk ID
azureml://registries/azureml-bria/models/Bria-2.3-Fast/versions/1model , salinazureml://registries/azureml-bria/models/Bria-2.3-Fast.
Bagian berikutnya mencakup langkah-langkah untuk berlangganan ruang kerja Anda ke penawaran model. Anda dapat melewati bagian ini dan lanjutkan ke Menyebarkan model ke penyebaran standar, jika Anda menyebarkan model Microsoft.
Berlangganan ruang kerja Anda ke penawaran model
Penyebaran standar dapat menyebarkan model yang ditawarkan Microsoft dan non-Microsoft. Untuk model Microsoft (seperti model Phi-3), Anda tidak perlu membuat langganan Azure Marketplace dan Anda dapat menyebarkannya ke penyebaran standar secara langsung untuk menggunakan prediksinya. Untuk model non-Microsoft, Anda perlu membuat langganan terlebih dahulu. Jika ini pertama kalinya Anda menyebarkan model di ruang kerja, Anda harus berlangganan ruang kerja Anda untuk penawaran model tertentu dari Azure Marketplace. Setiap ruang kerja memiliki langganannya sendiri ke penawaran Marketplace Azure model tertentu, yang memungkinkan Anda mengontrol dan memantau pengeluaran.
Catatan
Model yang ditawarkan melalui Azure Marketplace tersedia untuk penyebaran ke penyebaran standar di wilayah tertentu. Periksa Ketersediaan wilayah untuk model dalam penyebaran standar untuk memverifikasi model dan wilayah mana yang tersedia. Jika yang Anda butuhkan tidak tercantum, Anda dapat menyebarkan ke ruang kerja di wilayah yang didukung lalu menggunakan penyebaran standar dari ruang kerja yang berbeda.
Buat langganan marketplace untuk model. Saat membuat langganan, Anda menerima syarat dan ketentuan yang terkait dengan penawaran model. Ingat bahwa Anda tidak perlu melakukan langkah ini untuk model yang ditawarkan Microsoft (seperti Phi-3).
Pada halaman Detail model, pilih Gunakan model ini. Jendela Opsi penyebaran terbuka, memberi Anda pilihan antara penyebaran standar (API tanpa server) dan penyebaran menggunakan komputasi terkelola.
Catatan
Untuk model yang hanya dapat disebarkan melalui penyebaran standar, wizard penyebaran standar terbuka tepat setelah Anda memilih Gunakan model ini dari halaman detail model.
Pilih API Tanpa Server untuk membuka wizard penyebaran standar.
Jika Anda melihat catatan Anda sudah memiliki langganan Marketplace Azure untuk ruang kerja ini, Anda tidak perlu membuat langganan karena Anda sudah memilikinya. Anda dapat melanjutkan ke Menyebarkan model secara standar.
Di wizard penyebaran, pilih tautan untuk Marketplace Azure Ketentuan untuk mempelajari selengkapnya tentang ketentuan penggunaan. Anda juga dapat memilih tab Harga dan istilah untuk mempelajari tentang harga untuk model yang dipilih.
Pada wizard penyebaran, pilih tautan untuk Ketentuan Azure Marketplace untuk mempelajari lebih lanjut tentang ketentuan penggunaan. Anda juga dapat memilih tab detail penawaran Marketplace untuk mempelajari tentang harga untuk model yang dipilih.
Pilih Berlangganan dan Sebarkan.
Setelah Anda berlangganan ruang kerja untuk penawaran Marketplace Azure tertentu, penyebaran berikutnya dari penawaran yang sama di ruang kerja yang sama tidak memerlukan berlangganan lagi.
Kapan saja, Anda dapat melihat penawaran model tempat ruang kerja Anda saat ini berlangganan:
Masuk ke portal Azure
Navigasikan ke grup sumber daya tempat ruang kerja berada.
Pada filter Jenis, pilih SaaS.
Anda melihat semua penawaran yang saat ini Anda berlangganan.
Pilih sumber daya apa pun untuk melihat detailnya.
Terapkan model ke penyebaran standar
Setelah membuat langganan untuk model non-Microsoft, Anda dapat menyebarkan model terkait ke penyebaran standar. Untuk model Microsoft (seperti model Phi-3), Anda tidak perlu membuat langganan.
Penyebaran standar menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di langganan Anda, sambil mempertahankan keamanan perusahaan dan kebutuhan organisasi kepatuhan. Opsi penyebaran ini tidak memerlukan kuota dari langganan Anda.
Di bagian ini, Anda membuat titik akhir dengan nama Bria-2.3-Fast.
Membuat titik akhir tanpa server
Untuk menyebarkan model Microsoft yang tidak memerlukan berlangganan penawaran model, pilih Gunakan model ini lalu pilih API Tanpa Server untuk membuka wizard penyebaran.
Atau, untuk model non-Microsoft yang memerlukan langganan model, jika Anda telah berlangganan ruang kerja Anda ke penawaran model di bagian sebelumnya, lanjutkan untuk memilih Sebarkan. Atau, pilih Lanjutkan penyebaran (jika wizard penyebaran Anda memiliki catatan Anda sudah memiliki langganan Azure Marketplace untuk ruang kerja ini).
Beri nama penyebaran. Nama ini menjadi bagian dari URL API penyebaran. URL ini harus unik di setiap wilayah Azure.
Petunjuk / Saran
Opsi Filter konten (pratinjau) diaktifkan secara default. Biarkan pengaturan default untuk layanan mendeteksi konten berbahaya seperti konten kebencian, bahaya diri, seksual, dan kekerasan. Untuk informasi selengkapnya tentang pemfilteran konten (pratinjau), lihat Keamanan konten untuk model yang disebarkan melalui penyebaran standar.
Pilih Sebarkan. Tunggu hingga penyebaran siap dan Anda diarahkan ke halaman Penyebaran.
Kapan saja, Anda dapat melihat titik akhir yang disebarkan ke ruang kerja Anda:
Buka ruang kerja Anda.
Pilih Titik akhir.
Pilih tab Titik akhir tanpa server untuk menampilkan penyebaran standar.
Titik akhir yang dibuat menggunakan autentikasi kunci untuk otorisasi. Gunakan langkah-langkah berikut untuk mendapatkan kunci yang terkait dengan titik akhir tertentu.
- Untuk kembali ke halaman penyebaran, pilih nama titik akhir dari daftar titik akhir tanpa server.
- Catat Target URI dan Kunci endpoint. Gunakan untuk memanggil penyebaran dan menghasilkan prediksi.
Catatan
Saat menggunakan portal Microsoft Azure, penyebaran standar tidak ditampilkan secara default pada grup sumber daya. Gunakan opsi Perlihatkan jenis tersembunyi untuk menampilkannya pada grup sumber daya.
Pada titik ini, titik akhir Anda siap digunakan.
Jika Anda perlu menggunakan penyebaran ini dari ruang kerja yang berbeda, atau Anda berencana untuk menggunakan prompt flow untuk membangun aplikasi cerdas, Anda perlu membuat koneksi ke penyebaran standar. Untuk mempelajari cara mengonfigurasi penyebaran standar yang ada di ruang kerja atau hub baru, lihat Menggunakan penyebaran standar yang disebarkan dari ruang kerja yang berbeda atau dari alur Prompt.
Petunjuk / Saran
Jika Anda menggunakan alur perintah di ruang kerja yang sama tempat penyebaran disebarkan, Anda masih perlu membuat koneksi.
Gunakan penyebaran standar
Model yang disebarkan di Azure Machine Learning dan Microsoft Foundry dalam penyebaran standar mendukung AZURE AI Model Inference API yang mengekspos serangkaian kemampuan umum untuk model dasar dan yang dapat digunakan oleh pengembang untuk mengonsumsi prediksi dari serangkaian model yang beragam dengan cara yang seragam dan konsisten.
Baca selengkapnya tentang kemampuan API ini dan bagaimana Anda dapat menggunakannya saat membangun aplikasi.
Menghapus titik akhir dan langganan
Anda dapat menghapus langganan model dan titik akhir. Menghapus langganan model membuat titik akhir terkait menjadi Tidak Sehat dan tidak dapat digunakan.
Untuk menghapus penyebaran standar:
Pergi ke Azure Machine Learning studio.
Pilih Titik akhir dari bilah sisi kiri.
Pilih tab Titik akhir tanpa server untuk menampilkan penyebaran standar.
Buka titik akhir yang ingin Anda hapus.
Pilih Hapus.
Untuk menghapus langganan model terkait:
Masuk ke portal Azure
Navigasikan ke grup sumber daya tempat ruang kerja berada.
Pada filter Jenis, pilih SaaS.
Pilih langganan yang ingin Anda hapus.
Pilih Hapus.
Aspek dan pertimbangan biaya dan kuota pada model yang diterapkan sebagai penyebaran standar
Kuota dikelola per penyebaran. Setiap penyebaran memiliki batas tarif 200.000 token per menit dan 1.000 permintaan API per menit. Namun, saat ini kami membatasi satu penyebaran per model per ruang kerja. Hubungi Dukungan Microsoft Azure jika batas tarif saat ini tidak cukup untuk skenario Anda.
Biaya untuk model Microsoft
Anda dapat menemukan informasi harga pada tab Harga dan ketentuan penyihir penyiapan saat menyebarkan model Microsoft (seperti model Phi-3) sebagai penyebaran standar.
Biaya untuk model non-Microsoft
Model non-Microsoft yang disebarkan sebagai penyebaran standar ditawarkan melalui Azure Marketplace dan terintegrasi dengan Foundry untuk digunakan. Anda dapat menemukan harga Marketplace Azure saat menyebarkan atau menyempurnakan model ini.
Setiap kali ruang kerja berlangganan penawaran tertentu dari Azure Marketplace, sumber daya baru dibuat untuk melacak biaya yang terkait dengan konsumsinya. Sumber daya yang sama digunakan untuk melacak biaya yang terkait dengan inferensi dan penyempurnaan model; namun, beberapa alat ukur tersedia untuk melacak setiap skenario secara independen.
Untuk informasi selengkapnya tentang cara melacak biaya, lihat Memantau biaya untuk model yang ditawarkan melalui Marketplace Azure.
Izin yang diperlukan untuk berlangganan penawaran model
Kontrol akses berbasis peran Azure (Azure RBAC) digunakan untuk memberikan akses ke operasi di Azure Machine Learning. Untuk melakukan langkah-langkah dalam artikel ini, akun pengguna Anda harus diberi peran Pemilik, Kontributor, atau Pengembang Azure AI untuk langganan Azure. Atau, akun Anda dapat diberi peran kustom yang memiliki izin berikut:
Pada langganan Azure—untuk berlangganan ruang kerja ke penawaran Marketplace Azure, sekali untuk setiap ruang kerja, per penawaran:
Microsoft.MarketplaceOrdering/agreements/offers/plans/readMicrosoft.MarketplaceOrdering/agreements/offers/plans/sign/actionMicrosoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/readMicrosoft.Marketplace/offerTypes/publishers/offers/plans/agreements/readMicrosoft.SaaS/register/action
Pada grup sumber daya—untuk membuat dan menggunakan sumber daya SaaS:
Microsoft.SaaS/resources/readMicrosoft.SaaS/resources/write
Di ruang kerja—untuk menyebarkan titik akhir (peran ilmuwan data Azure Pembelajaran Mesin sudah berisi izin ini):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Untuk informasi selengkapnya tentang izin, lihat Mengelola akses ke ruang kerja Azure Pembelajaran Mesin.