Bagikan melalui


Menyebarkan model sebagai titik akhir API tanpa server

Dalam artikel ini, Anda mempelajari cara menyebarkan model dari katalog model sebagai API tanpa server dengan penagihan berbasis token bayar sesuai penggunaan.

Model tertentu dalam katalog model dapat disebarkan sebagai API tanpa server dengan penagihan bayar sesuai penggunaan. Penyebaran semacam ini menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di langganan Anda, sambil menjaga keamanan dan kepatuhan perusahaan yang dibutuhkan organisasi. Opsi penyebaran ini tidak memerlukan kuota dari langganan Anda.

Prasyarat

  • Langganan Azure dengan metode pembayaran yang valid. Langganan Azure gratis atau uji coba tidak akan berfungsi. Jika Anda tidak memiliki langganan Azure, buat akun Azure berbayar untuk memulai.

  • Ruang kerja Azure Machine Learning.

  • Kontrol akses berbasis peran Azure (Azure RBAC) digunakan untuk memberikan akses ke operasi di Azure Machine Learning. Untuk melakukan langkah-langkah dalam artikel ini, akun pengguna Anda harus diberi peran Pengembang Azure AI pada grup sumber daya. Untuk informasi selengkapnya tentang izin, lihat Kontrol akses berbasis peran di Azure Pembelajaran Mesin.

  • Anda perlu menginstal perangkat lunak berikut untuk bekerja dengan Azure Pembelajaran Mesin:

    Anda dapat menggunakan browser web yang kompatibel untuk menavigasi Azure Pembelajaran Mesin.

Berlangganan ruang kerja Anda ke penawaran model

Untuk model yang ditawarkan melalui Marketplace Azure, Anda dapat menyebarkannya ke titik akhir API tanpa server untuk menggunakan prediksinya. Jika ini pertama kalinya Anda menyebarkan model di ruang kerja, Anda harus berlangganan ruang kerja Anda untuk penawaran model tertentu dari Marketplace Azure. Setiap ruang kerja memiliki langganannya sendiri ke penawaran Marketplace Azure model tertentu, yang memungkinkan Anda mengontrol dan memantau pengeluaran.

Catatan

Model yang ditawarkan melalui Marketplace Azure tersedia untuk penyebaran ke titik akhir API tanpa server di wilayah tertentu. Periksa Ketersediaan wilayah untuk model di titik akhir API Tanpa Server untuk memverifikasi wilayah mana yang tersedia. Jika yang Anda butuhkan tidak tercantum, Anda dapat menyebarkan ke ruang kerja di wilayah yang didukung lalu menggunakan titik akhir API tanpa server dari ruang kerja yang berbeda.

  1. Masuk ke Studio Azure Machine Learning

  2. Pastikan akun Anda memiliki izin peran Pengembang Azure AI pada grup sumber daya, atau Anda memenuhi izin yang diperlukan untuk berlangganan penawaran model.

  3. Buka ruang kerja Anda.

  4. Pilih Katalog model dari bilah sisi kiri dan temukan kartu model model yang ingin Anda sebarkan. Dalam artikel ini, Anda memilih model Meta-Llama-3-8B-Instruct .

    1. Jika Anda menyebarkan model menggunakan Azure CLI, Python SDK, atau ARM, salin ID Model.

    Penting

    Jangan sertakan versi saat menyalin ID Model. Titik akhir API tanpa server selalu menyebarkan versi terbaru model yang tersedia. Misalnya, untuk ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3model , salin azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Cuplikan layar memperlihatkan halaman detail model.

  5. Buat langganan marketplace model. Saat membuat langganan, Anda menerima syarat dan ketentuan yang terkait dengan penawaran model.

    1. Pada halaman Detail model, pilih Sebarkan lalu pilih API Tanpa Server untuk membuka wizard penyebaran.

    2. Pilih kotak centang untuk mengakui kebijakan pembelian Microsoft.

      Cuplikan layar yang menunjukkan cara menyebarkan model dengan opsi API tanpa server.

    3. Jika Anda melihat catatan Anda sudah memiliki langganan Marketplace Azure untuk ruang kerja ini, Anda tidak perlu membuat langganan karena Anda sudah memilikinya. Anda dapat melanjutkan ke Menyebarkan model ke titik akhir API tanpa server.

    4. Di wizard penyebaran, pilih tautan untuk Marketplace Azure Ketentuan untuk mempelajari selengkapnya tentang ketentuan penggunaan. Anda juga dapat memilih tab Harga dan istilah untuk mempelajari tentang harga untuk model yang dipilih.

    5. Pada wizard penyebaran, pilih tautan untuk Marketplace Azure Ketentuan untuk mempelajari selengkapnya tentang ketentuan penggunaan. Anda juga dapat memilih tab detail penawaran Marketplace untuk mempelajari tentang harga untuk model yang dipilih.

    6. Pilih Berlangganan dan Sebarkan.

  6. Setelah Anda mendaftarkan ruang kerja untuk penawaran Marketplace Azure tertentu, penyebaran berikutnya dari penawaran yang sama di ruang kerja yang sama tidak memerlukan berlangganan lagi.

  7. Kapan saja, Anda dapat melihat penawaran model tempat ruang kerja Anda saat ini berlangganan:

    1. Masuk ke portal Azure

    2. Navigasikan ke grup sumber daya tempat ruang kerja berada.

    3. Pada filter Jenis, pilih SaaS.

    4. Anda melihat semua penawaran yang saat ini Anda berlangganan.

    5. Pilih sumber daya apa pun untuk melihat detailnya.

Menyebarkan model ke titik akhir API tanpa server

Setelah membuat langganan model, Anda dapat menyebarkan model terkait ke titik akhir API tanpa server. Titik akhir API tanpa server menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di langganan Anda, sambil menjaga keamanan perusahaan dan organisasi kepatuhan membutuhkan. Opsi penyebaran ini tidak memerlukan kuota dari langganan Anda.

Dalam artikel ini, Anda membuat titik akhir dengan nama meta-llama3-8b-qwerty.

  1. Membuat titik akhir tanpa server

    1. Dari wizard sebelumnya, pilih Sebarkan (jika Anda baru saja berlangganan ruang kerja ke penawaran model di bagian sebelumnya), atau pilih Lanjutkan untuk menyebarkan (jika wizard penyebaran Anda memiliki catatan Anda sudah memiliki langganan Marketplace Azure untuk ruang kerja ini).

      Cuplikan layar memperlihatkan ruang kerja yang sudah berlangganan penawaran.

    2. Beri nama penyebaran. Nama ini menjadi bagian dari URL API penyebaran. URL ini harus unik di setiap wilayah Azure.

      Cuplikan layar memperlihatkan cara menentukan nama penyebaran yang ingin Anda buat.

    3. Pilih Sebarkan. Tunggu hingga penyebaran siap dan Anda diarahkan ke halaman Penyebaran.

  2. Kapan saja, Anda dapat melihat titik akhir yang disebarkan ke ruang kerja Anda:

    1. Buka ruang kerja Anda.

    2. Pilih Titik akhir.

    3. Pilih tab Titik akhir tanpa server untuk menampilkan titik akhir API tanpa server.

  3. Titik akhir yang dibuat menggunakan autentikasi kunci untuk otorisasi. Gunakan langkah-langkah berikut untuk mendapatkan kunci yang terkait dengan titik akhir tertentu.

    1. Untuk kembali ke halaman penyebaran, pilih nama titik akhir dari daftar titik akhir tanpa server.
    2. Perhatikan Target URI dan Kunci titik akhir. Gunakan untuk memanggil penyebaran dan menghasilkan prediksi.

    Catatan

    Saat menggunakan portal Azure, titik akhir API tanpa server tidak ditampilkan secara default pada grup sumber daya. Gunakan opsi Perlihatkan jenis tersembunyi untuk menampilkannya pada grup sumber daya.

  4. Pada titik ini, titik akhir Anda siap digunakan.

  5. Jika Anda perlu menggunakan penyebaran ini dari ruang kerja yang berbeda, atau Anda berencana untuk menggunakan alur prompt untuk membangun aplikasi cerdas, Anda perlu membuat koneksi ke penyebaran API tanpa server. Untuk mempelajari cara mengonfigurasi titik akhir API tanpa server yang ada pada proyek atau hub baru, lihat Menggunakan titik akhir API tanpa server yang disebarkan dari ruang kerja yang berbeda atau dari alur Prompt.

    Tip

    Jika Anda menggunakan alur perintah di ruang kerja yang sama tempat penyebaran disebarkan, Anda masih perlu membuat koneksi.

Menggunakan titik akhir API tanpa server

Model yang disebarkan di Azure Pembelajaran Mesin dan studio Azure AI di titik akhir API Tanpa Server mendukung API Inferensi Model Azure AI yang memaparkan serangkaian kemampuan umum untuk model dasar dan yang dapat digunakan oleh pengembang untuk menggunakan prediksi dari serangkaian model yang beragam dengan cara yang seragam dan konsisten.

Baca selengkapnya tentang kemampuan API ini dan bagaimana Anda dapat memanfaatkannya saat membangun aplikasi.

Menghapus titik akhir dan langganan

Anda dapat menghapus langganan model dan titik akhir. Menghapus langganan model membuat titik akhir terkait menjadi Tidak Sehat dan tidak dapat digunakan.

Untuk menghapus titik akhir API tanpa server:

  1. Buka studio Azure Pembelajaran Mesin.

  2. Pilih Titik akhir dari bilah sisi kiri.

  3. Pilih tab Titik akhir tanpa server untuk menampilkan titik akhir API tanpa server.

  4. Buka titik akhir yang ingin Anda hapus.

  5. Pilih Hapus.

Untuk menghapus langganan model terkait:

  1. Masuk ke portal Azure

  2. Navigasikan ke grup sumber daya tempat ruang kerja berada.

  3. Pada filter Jenis, pilih SaaS.

  4. Pilih langganan yang ingin Anda hapus.

  5. Pilih Hapus.

Pertimbangan biaya dan kuota untuk model yang disebarkan sebagai titik akhir API tanpa server

Model yang disebarkan sebagai titik akhir API tanpa server ditawarkan melalui Marketplace Azure dan terintegrasi dengan Azure Pembelajaran Mesin untuk digunakan. Anda dapat menemukan harga Marketplace Azure saat menyebarkan atau menyempurnakan model.

Setiap kali ruang kerja berlangganan penawaran tertentu dari Marketplace Azure, sumber daya baru dibuat untuk melacak biaya yang terkait dengan konsumsinya. Sumber daya yang sama digunakan untuk melacak biaya yang terkait dengan inferensi dan penyempurnaan; namun, beberapa meter tersedia untuk melacak setiap skenario secara independen.

Untuk informasi selengkapnya tentang cara melacak biaya, lihat Memantau biaya untuk model yang ditawarkan melalui Marketplace Azure.

Cuplikan layar yang menunjukkan sumber daya yang berbeda yang sesuai dengan penawaran model yang berbeda dan meter terkaitnya.

Kuota dikelola per penyebaran. Setiap penyebaran memiliki batas tarif 200.000 token per menit dan 1.000 permintaan API per menit. Namun, saat ini kami membatasi satu penyebaran per model per ruang kerja. Hubungi Dukungan Microsoft Azure jika batas tarif saat ini tidak cukup untuk skenario Anda.

Izin yang diperlukan untuk berlangganan penawaran model

Kontrol akses berbasis peran Azure (Azure RBAC) digunakan untuk memberikan akses ke operasi di Azure Machine Learning. Untuk melakukan langkah-langkah dalam artikel ini, akun pengguna Anda harus diberi peran Pemilik, Kontributor, atau Pengembang Azure AI untuk langganan Azure. Atau, akun Anda dapat diberi peran kustom yang memiliki izin berikut:

  • Pada langganan Azure—untuk berlangganan ruang kerja ke penawaran Marketplace Azure, sekali untuk setiap ruang kerja, per penawaran:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Pada grup sumber daya—untuk membuat dan menggunakan sumber daya SaaS:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • Di ruang kerja—untuk menyebarkan titik akhir (peran ilmuwan data Azure Pembelajaran Mesin sudah berisi izin ini):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Untuk informasi selengkapnya tentang izin, lihat Mengelola akses ke ruang kerja Azure Pembelajaran Mesin.