AksWebservice Kelas

Mewakili model pembelajaran mesin yang disebarkan sebagai titik akhir layanan web pada Azure Kubernetes Service.

Layanan yang disebarkan dibuat dari model, skrip, serta file yang diasosiasikan. Layanan web yang dihasilkan adalah titik akhir HTTP yang bebannya diseimbangkan dengan REST API. Anda dapat mengirim data ke API ini serta menerima prediksi yang dikembalikan oleh model.

AksWebservice menyebarkan satu layanan ke satu titik akhir. Untuk menyebarkan beberapa layanan ke satu titik akhir, gunakanlah kelas AksEndpoint.

Untuk informasi selengkapnya, lihat Menyebarkan model ke kluster Azure Kubernetes Service.

Menginisialisasi instans Webservice.

Konstruktor Webservice mengambil representasi cloud dari objek Webservice yang terkait dengan ruang kerja yang disediakan. Ini akan mengembalikan instans kelas anak yang sesuai dengan jenis tertentu dari objek Webservice yang diambil.

Warisan
AksWebservice

Konstruktor

AksWebservice(workspace, name)

Parameter

workspace
Workspace
Diperlukan

Objek ruang kerja yang berisi objek Layanan Web yang akan diambil.

name
str
Diperlukan

Nama objek Layanan Web yang akan diambil.

Keterangan

Pola penyebaran yang disarankan adalah membuat objek konfigurasi penyebaran dengan deploy_configuration metode lalu kemudian menggunakannya dengan deploy metode Model kelas seperti yang ditunjukkan di bawah ini.


   # Set the web service configuration (using default here)
   aks_config = AksWebservice.deploy_configuration()

   # # Enable token auth and disable (key) auth on the webservice
   # aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)

Sampel lengkap tersedia dari https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb

Ada sejumlah cara untuk menyebarkan model sebagai layanan web, termasuk dengan:

  • deploy metode untuk Model model yang sudah terdaftar di ruang kerja.

  • deploy_from_image metode dari Webservice.

  • deploy_from_model metode dari Webservice untuk model yang sudah terdaftar di ruang kerja. Metode ini akan membuat sebuah gambar.

  • deploymetode dari Webservice, yang akan mendaftarkan model dan membuat gambar.

Untuk informasi tentang bekerja dengan layanan web, lihat

Bagian Variabel mencantumkan atribut representasi lokal objek AksWebservice cloud. Variabel-variabel ini harus dianggap baca-saja. Mengubah nilainya tidak akan tercermin dalam objek cloud yang sesuai.

Variabel

enable_app_insights
bool

Apakah pengelogan Application Insights diaktifkan untuk Layanan Web atau tidak.

autoscaler
AutoScaler

Objek Penskala otomatis untuk Layanan web.

compute_name
str

Nama ComputeTarget tempat Layanan web disebarkan.

container_resource_requirements
ContainerResourceRequirements

Persyaratan sumber daya kontainer untuk Layanan Web.

liveness_probe_requirements
LivenessProbeRequirements

Persyaratan pemeriksaan keaktifan untuk Layanan Web.

data_collection
DataCollection

Objek DataCollection untuk Layanan web.

max_concurrent_requests_per_container
int

Jumlah maksimum permintaan serentak per kontainer untuk Layanan Web.

max_request_wait_time
int

Waktu tunggu permintaan maksimum untuk Layanan Web, dalam milidetik.

num_replicas
int

Jumlah replika untuk Layanan Web. Setiap replika sesuai dengan pod AKS.

scoring_timeout_ms
int

Batas waktu penilaian untuk Layanan Web, dalam milidetik.

azureml.core.webservice.AksWebservice.scoring_uri
str

Titik akhir penilaian untuk Layanan Web

is_default
bool

Jika Webservice adalah versi default untuk AksEndpoint induk.

traffic_percentile
int

Berapa persentase lalu lintas untuk dirutekan ke Webservice di AksEndpoint induk.

version_type
VersionType

Jenis versi untuk Layanan Web di induk AksEndpoint.

token_auth_enabled
bool

Apakah autentikasi token diaktifkan untuk Layanan Web atau tidak.

environment
Environment

Objek Lingkungan yang digunakan untuk membuat Layanan Web.

azureml.core.webservice.AksWebservice.models
list[Model]

Daftar Model yang disebarkan ke Layanan web.

deployment_status
str

Status penyebaran Layanan Web.

namespace
str

Kumpulan nama XML AKS dari Layanan Web.

azureml.core.webservice.AksWebservice.swagger_uri
str

Titik akhir swagger untuk Layanan Web.

Metode

add_properties

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

add_tags

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

Menaikkan WebserviceException.

deploy_configuration

Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.

get_access_token

Mengambil token autentikasi untuk Layanan web ini.

get_token

TIDAK DIGUNAKAN LAGI. Gunakan metode get_access_token sebagai gantinya.

Mengambil token autentikasi untuk Layanan web ini.

remove_tags

Hapus kunci yang ditentukan dari kamus tag Layanan Web ini.

run

Hubungi Layanan Web ini dengan input yang disediakan.

serialize

Konversi Layanan Web ini menjadi kamus serial JSON.

update

Perbarui Layanan Web dengan properti yang disediakan.

Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini.

add_properties

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

add_properties(properties)

Parameter

properties
dict[str, str]
Diperlukan

Kamus properti yang ditambahkan.

add_tags

Tambahkan pasangan nilai kunci ke kamus properti Layanan Web ini.

Menaikkan WebserviceException.

add_tags(tags)

Parameter

tags
dict[str, str]
Diperlukan

Kamus tag yang ditambahkan.

Pengecualian

deploy_configuration

Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)

Parameter

autoscale_enabled
bool
nilai default: None

Apakah akan mengaktifkan penskalaan otomatis untuk Webservice ini atau tidak. Default ke True jika num_replicas Tidak Ada.

autoscale_min_replicas
int
nilai default: None

Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Webservice ini. Default ke 1.

autoscale_max_replicas
int
nilai default: None

Jumlah maksimum kontainer yang digunakan ketika melakukan penskalaan otomatis Webservice ini. Default ke 10.

autoscale_refresh_seconds
int
nilai default: None

Seberapa sering pembuat skala otomatis mencoba menskalakan Webservice ini. Default ke 1.

autoscale_target_utilization
int
nilai default: None

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data
bool
nilai default: None

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi kunci untuk Layanan web ini atau tidak. Default ke True.

cpu_cores
float
nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0.1. Sesuai dengan permintaan inti pod, bukan batas, pada Azure Kubernetes Service.

memory_gb
float
nilai default: None

Jumlah memori (dalam GB) yang akan dialokasikan untuk Webservice ini. Bisa berupa desimal. Default ke 0.5. Sesuai dengan permintaan memori pod, bukan batasnya, di Azure Kubernetes Service.

enable_app_insights
bool
nilai default: None

Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak. Default ke False.

scoring_timeout_ms
int
nilai default: None

Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests
int
nilai default: None

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
nilai default: None

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key
str
nilai default: None

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key
str
nilai default: None

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description
str
nilai default: None

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores
int
nilai default: None

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds
int
nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
nilai default: None

Jumlah detik setelah kontainer dimulai sebelum pemeriksaan keaktifan diinisiasi. Default ke 310.

timeout_seconds
int
nilai default: None

Jumlah detik setelah waktu probe keaktifan habis. Default ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
nilai default: None

Keberhasilan minimum berturut-turut untuk pemeriksaan keaktifan yang dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace
str
nilai default: None

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika diaktifkan, pengguna dapat mengakses Layanan Web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory. Default ke False.

compute_target_name
str
nilai default: None

Nama target komputasi tujuan penyebaran

cpu_cores_limit
float
nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled
bool
nilai default: None

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

Mengembalikan

Objek konfigurasi yang digunakan saat menyebarkan AksWebservice.

Tipe hasil

Pengecualian

get_access_token

Mengambil token autentikasi untuk Layanan web ini.

get_access_token()

Mengembalikan

Objek yang menjelaskan token autentikasi untuk Layanan web ini.

Tipe hasil

Pengecualian

get_token

TIDAK DIGUNAKAN LAGI. Gunakan metode get_access_token sebagai gantinya.

Mengambil token autentikasi untuk Layanan web ini.

get_token()

Mengembalikan

Token autentikasi untuk Layanan web ini dan kapan harus melakukan refresh.

Tipe hasil

Pengecualian

remove_tags

Hapus kunci yang ditentukan dari kamus tag Layanan Web ini.

remove_tags(tags)

Parameter

tags
list[str]
Diperlukan

Daftar kunci yang akan dihapus

run

Hubungi Layanan Web ini dengan input yang disediakan.

run(input_data)

Parameter

input_data
<xref:varies>
Diperlukan

Input untuk memanggil Layanan Web

Mengembalikan

Hasil dari pemanggilan Layanan Web

Tipe hasil

Pengecualian

serialize

Konversi Layanan Web ini menjadi kamus serial JSON.

serialize()

Mengembalikan

Representasi JSON dari Layanan Web ini.

Tipe hasil

update

Perbarui Layanan Web dengan properti yang disediakan.

Nilai yang dibiarkan None akan tetap tidak berubah di Layanan Web ini.

update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)

Parameter

image
Image
nilai default: None

Gambar baru yang akan disebarkan ke Layanan Web

autoscale_enabled
bool
nilai default: None

Mengaktifkan atau menonaktifkan penskalaan otomatis Layanan web ini

autoscale_min_replicas
int
nilai default: None

Jumlah minimum kontainer yang digunakan saat melakukan penskalaan otomatis Layanan web ini

autoscale_max_replicas
int
nilai default: None

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini

autoscale_refresh_seconds
int
nilai default: None

Seberapa sering penskala otomatis mencoba menskalakan Layanan Web ini

autoscale_target_utilization
int
nilai default: None

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini

collect_model_data
bool
nilai default: None

Mengaktifkan atau menonaktifkan pengumpulan data model untuk Layanan web ini

auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi untuk Layanan web ini atau tidak

cpu_cores
float
nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk Layanan web ini. Bisa berupa desimal

memory_gb
float
nilai default: None

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal

enable_app_insights
bool
nilai default: None

Apakah akan mengaktifkan pengelogan Application Insights untuk Layanan web ini atau tidak

scoring_timeout_ms
int
nilai default: None

Batas waktu untuk memberlakukan penilaian panggilan ke Layanan web ini

replica_max_concurrent_requests
int
nilai default: None

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini.

max_request_wait_time
int
nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam antrean (dalam milidetik) sebelum menampilkan kesalahan 503

num_replicas
int
nilai default: None

Jumlah kontainer yang dialokasikan untuk Layanan web ini

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Layanan Web ini. Akan menggantikan tag yang tersedia.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk ditambahkan ke kamus properti yang tersedia

description
str
nilai default: None

Deskripsi yang akan diberikan untuk Layanan web ini

models
list[Model]
nilai default: None

Daftar objek Model yang untuk paket dengan layanan yang diperbarui

inference_config
InferenceConfig
nilai default: None

Objek InferenceConfig yang digunakan untuk menyediakan properti penyebaran model yang diperlukan.

gpu_cores
int
nilai default: None

Jumlah core GPU yang akan dialokasikan untuk Layanan web ini

period_seconds
int
nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
nilai default: None

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai.

timeout_seconds
int
nilai default: None

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Default ke 1 detik. Nilai minimalnya adalah 1.

success_threshold
int
nilai default: None

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace
str
nilai default: None

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan info masuk Azure Active Directory mereka. Default ke False

cpu_cores_limit
float
nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

kwargs
<xref:varies>
Diperlukan

sertakan params untuk mendukung migrasi layanan web AKS ke titik akhir dan penyebaran online Kubernetes. is_migration=True|False, compute_target=.

Pengecualian