AksEndpoint Kelas

Catatan

Ini adalah kelas eksperimental, dan dapat berubah kapan saja. Lihat https://aka.ms/azuremlexperimental untuk mengetahui informasi selengkapnya.

Menunjukkan kumpulan versi layanan web di balik titik akhir yang sama yang berjalan di Azure Kubernetes Service.

Sedangkan AksWebservice menyebarkan satu layanan dengan titik akhir penilaian tunggal, kelas AksEndpoint memungkinkan Anda untuk menyebarkan beberapa versi layanan web di balik titik akhir penilaian yang sama. Setiap versi layanan web dapat dikonfigurasi untuk melayani sekian persentase lalu lintas sehingga Anda dapat menyebarkan model secara terkontrol, misalnya, untuk pengujian A/B. AksEndpoint memungkinkan penyebaran dari objek model yang mirip dengan AksWebservice.

Menginisialisasi instans Webservice.

Konstruktor Webservice mengambil representasi cloud dari objek Webservice yang terkait dengan ruang kerja yang disediakan. Ini akan mengembalikan instans kelas anak yang sesuai dengan jenis tertentu dari objek Webservice yang diambil.

Warisan
AksEndpoint

Konstruktor

AksEndpoint(workspace, name)

Parameter

workspace
Workspace
Diperlukan

Objek ruang kerja yang berisi objek Layanan Web yang akan diambil.

name
str
Diperlukan

Nama objek Layanan Web yang akan diambil.

Variabel

versions
dict[str, AksWebservice]

Kamus nama versi hingga objek versi. Berisi semua versi yang disebarkan sebagai bagian dari Titik Akhir ini.

Metode

create_version

Tambahkan versi baru di Titik Akhir dengan properti yang disediakan.

delete_version

Hapus versi di Titik Akhir.

deploy_configuration

Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.

serialize

Konversi Layanan Web ini menjadi kamus serial JSON.

update

Perbarui Titik Akhir dengan properti yang disediakan.

Nilai yang tersisa sebagai Tidak Ada akan tetap tidak berubah di Titik Akhir ini

update_version

Perbarui versi yang ada di Titik Akhir dengan properti yang disediakan.

Nilai yang tersisa sebagai Tidak Ada akan tetap tidak berubah dalam versi ini.

create_version

Tambahkan versi baru di Titik Akhir dengan properti yang disediakan.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameter

version_name
str
Diperlukan

Nama versi yang akan ditambahkan di titik akhir.

autoscale_enabled
bool
nilai default: None

Apakah akan mengaktifkan penskalaan otomatis untuk versi ini di Titik Akhir atau tidak. Default ke True jika num_replicas adalah Tidak Ada.

autoscale_min_replicas
int
nilai default: None

Jumlah minimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 1

autoscale_max_replicas
int
nilai default: None

Jumlah maksimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 10

autoscale_refresh_seconds
int
nilai default: None

Seberapa sering penskala otomatis harus mencoba menskalakan versi ini di Titik Akhir. Default ke 1

autoscale_target_utilization
int
nilai default: None

Penggunaan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan versi ini di Titik Akhir. Default ke 70

collect_model_data
bool
nilai default: None

Apakah akan mengaktifkan kumpulan data model untuk versi ini di Titik Akhir atau tidak. Default ke False

cpu_cores
float
nilai default: None

Jumlah inti CPU yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,1

memory_gb
float
nilai default: None

Jumlah memori (dalam GB) yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,5

scoring_timeout_ms
int
nilai default: None

Batas waktu untuk menerapkan guna menilai panggilan ke versi ini di Titik Akhir. Default ke 60000.

replica_max_concurrent_requests
int
nilai default: None

Jumlah permintaan bersamaan maksimum setiap replika untuk mengizinkan versi ini di Titik Akhir. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
nilai default: None

Jumlah kontainer yang dialokasikan untuk versi ini di Titik Akhir. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis diaktifkan secara default.

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Titik Akhir ini.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk memberikan Titik Akhir ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description
str
nilai default: None

Deskripsi untuk memberikan Titik Akhir ini.

models
list[Model]
nilai default: None

Daftar objek Model untuk dikemas dengan layanan yang diperbarui.

inference_config
InferenceConfig
nilai default: None

Objek InferenceConfig yang digunakan untuk menyediakan properti penyebaran model yang diperlukan.

gpu_cores
int
nilai default: None

Jumlah inti GPU yang akan dialokasikan untuk versi ini di Titik Akhir. Default ke 0.

period_seconds
int
nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
nilai default: None

Jumlah detik setelah kontainer dimulai sebelum pemeriksaan keaktifan diinisiasi. Default ke 310.

timeout_seconds
int
nilai default: None

Jumlah detik setelah waktu probe keaktifan habis. Default ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
nilai default: None

Keberhasilan minimum berturut-turut untuk pemeriksaan keaktifan yang dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

traffic_percentile
float
nilai default: None

Jumlah lalu lintas yang diambil versi di titik akhir.

is_default
bool
nilai default: None

Apakah akan menjadikan versi ini sebagai versi default di Titik Akhir atau tidak. Default ke False.

is_control_version_type
bool
nilai default: None

Apakah akan menjadikan versi ini sebagai versi kontrol di Titik Akhir atau tidak. Default ke False.

cpu_cores_limit
float
nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

Pengecualian

delete_version

Hapus versi di Titik Akhir.

delete_version(version_name)

Parameter

version_name
str
Diperlukan

Nama versi di titik akhir yang akan dihapus.

Pengecualian

deploy_configuration

Buat objek konfigurasi untuk disebarkan ke target komputasi AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameter

autoscale_enabled
bool
nilai default: None

Apakah akan mengaktifkan penskalaan otomatis untuk versi ini di Titik Akhir atau tidak. Default ke True jika num_replicas adalah Tidak Ada.

autoscale_min_replicas
int
nilai default: None

Jumlah minimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 1.

autoscale_max_replicas
int
nilai default: None

Jumlah maksimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 10.

autoscale_refresh_seconds
int
nilai default: None

Seberapa sering penskala otomatis harus mencoba menskalakan versi ini di Titik Akhir. Default ke 1.

autoscale_target_utilization
int
nilai default: None

Penggunaan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan versi ini di Titik Akhir. Default ke 70.

collect_model_data
bool
nilai default: None

Apakah akan mengaktifkan kumpulan data model untuk versi ini di Titik Akhir atau tidak. Default ke False.

auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi kunci untuk versi ini di Titik Akhir atau tidak. Default ke True.

cpu_cores
float
nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,1

memory_gb
float
nilai default: None

Jumlah memori (dalam GB) yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,5

enable_app_insights
bool
nilai default: None

Apakah akan mengaktifkan pengelogan ApplicationInsights untuk versi ini di Titik Akhir atau tidak. Default ke False.

scoring_timeout_ms
int
nilai default: None

Batas waktu untuk menerapkan panggilan penilaian ke versi ini di Titik Akhir. Default ke 60000

replica_max_concurrent_requests
int
nilai default: None

Jumlah permintaan bersamaan maksimum setiap replika untuk mengizinkan versi ini di Titik Akhir. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
nilai default: None

Jumlah kontainer yang dialokasikan untuk versi ini di Titik Akhir. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis diaktifkan secara default.

primary_key
str
nilai default: None

Kunci autentikasi utama yang akan digunakan untuk Titik Akhir ini.

secondary_key
str
nilai default: None

Kunci autentikasi sekunder yang akan digunakan untuk Titik Akhir ini.

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Titik Akhir ini.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk memberikan Titik Akhir ini. Properti ini tidak dapat diubah setelah penyebaran, tetapi pasangan nilai kunci baru dapat ditambahkan

description
str
nilai default: None

Deskripsi untuk memberikan Titik Akhir ini.

gpu_cores
int
nilai default: None

Jumlah inti GPU yang akan dialokasikan untuk versi ini di Titik Akhir. Default ke 0.

period_seconds
int
nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
nilai default: None

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds
int
nilai default: None

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
nilai default: None

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
nilai default: None

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace
str
nilai default: None

Namespace Kubernetes untuk menyebarkan Titik Akhir ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Titik Akhir ini atau tidak. Jika autentikasi Token diaktifkan, pengguna dapat mengakses Titik Akhir ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

version_name
str
nilai default: None

Nama versi di titik akhir.

traffic_percentile
float
nilai default: None

jumlah lalu lintas yang diambil versi di titik akhir.

compute_target_name
str
nilai default: None

Nama target komputasi yang akan disebarkan

cpu_cores_limit
float
nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

Tipe hasil

Pengecualian

serialize

Konversi Layanan Web ini menjadi kamus serial JSON.

serialize()

Mengembalikan

Representasi JSON dari Layanan Web ini.

Tipe hasil

Pengecualian

update

Perbarui Titik Akhir dengan properti yang disediakan.

Nilai yang tersisa sebagai Tidak Ada akan tetap tidak berubah di Titik Akhir ini

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parameter

auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi kunci untuk versi ini di Titik Akhir atau tidak. Default ke True.

token_auth_enabled
bool
nilai default: None

Apakah akan mengaktifkan autentikasi Token untuk Titik Akhir ini atau tidak. Jika autentikasi Token diaktifkan, pengguna dapat mengakses Titik Akhir ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

enable_app_insights
bool
nilai default: None

Apakah akan mengaktifkan pengelogan Application Insights untuk versi ini di Titik Akhir atau tidak. Default ke False.

description
str
nilai default: None

Deskripsi untuk memberikan Titik Akhir ini.

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Titik Akhir ini.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk memberikan Titik Akhir ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

Pengecualian

update_version

Perbarui versi yang ada di Titik Akhir dengan properti yang disediakan.

Nilai yang tersisa sebagai Tidak Ada akan tetap tidak berubah dalam versi ini.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parameter

version_name
str
Diperlukan

Nama versi di titik akhir.

autoscale_enabled
bool
nilai default: None

Apakah akan mengaktifkan penskalaan otomatis untuk versi ini di Titik Akhir atau tidak. Default ke True jika num_replicas Tidak Ada.

autoscale_min_replicas
int
nilai default: None

Jumlah minimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 1.

autoscale_max_replicas
int
nilai default: None

Jumlah maksimum kontainer yang akan digunakan saat penskalaan otomatis versi ini di Titik Akhir. Default ke 10.

autoscale_refresh_seconds
int
nilai default: None

Seberapa sering penskala otomatis harus mencoba menskalakan versi ini di Titik Akhir. Default ke 1

autoscale_target_utilization
int
nilai default: None

Penggunaan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan versi ini di Titik Akhir. Default ke 70.

collect_model_data
bool
nilai default: None

Apakah akan mengaktifkan kumpulan data model untuk versi ini di Titik Akhir atau tidak. Default ke False.

cpu_cores
float
nilai default: None

Jumlah inti cpu yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,1

memory_gb
float
nilai default: None

Jumlah memori (dalam GB) yang akan dialokasikan untuk versi ini di Titik Akhir. Bisa berupa desimal. Default ke 0,5

scoring_timeout_ms
int
nilai default: None

Batas waktu untuk menerapkan guna menilai panggilan ke versi ini di Titik Akhir. Default ke 60000.

replica_max_concurrent_requests
int
nilai default: None

Jumlah permintaan bersamaan maksimum setiap replika untuk mengizinkan versi ini di Titik Akhir. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time
int
nilai default: None

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas
int
nilai default: None

Jumlah kontainer yang dialokasikan untuk versi ini di Titik Akhir. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis diaktifkan secara default.

tags
dict[str, str]
nilai default: None

Kamus tag nilai kunci untuk memberikan Titik Akhir ini.

properties
dict[str, str]
nilai default: None

Kamus properti nilai kunci untuk memberikan Titik Akhir ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description
str
nilai default: None

Deskripsi untuk memberikan Titik Akhir ini

models
list[Model]
nilai default: None

Daftar objek Model yang untuk paket dengan layanan yang diperbarui

inference_config
InferenceConfig
nilai default: None

Objek InferenceConfig yang digunakan untuk menyediakan properti penyebaran model yang diperlukan.

gpu_cores
int
nilai default: None

Jumlah inti GPU yang akan dialokasikan untuk versi ini di Titik Akhir. Default ke 0.

period_seconds
int
nilai default: None

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds
int
nilai default: None

Jumlah detik setelah kontainer dimulai sebelum pemeriksaan keaktifan diinisiasi. Default ke 310.

timeout_seconds
int
nilai default: None

Jumlah detik setelah waktu probe keaktifan habis. Default ke 2 detik. Nilai minimalnya adalah 1.

success_threshold
int
nilai default: None

Keberhasilan minimum berturut-turut untuk pemeriksaan keaktifan yang dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold
int
nilai default: None

Saat sebuah Pod dimulai dan probe keaktifan gagal, Kube akan mencoba waktu failureThreshold sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

traffic_percentile
float
nilai default: None

Jumlah lalu lintas yang diambil versi di titik akhir.

is_default
bool
nilai default: None

Apakah akan menjadikan versi ini sebagai versi default di Titik Akhir atau tidak. Default ke False.

is_control_version_type
bool
nilai default: None

Apakah akan menjadikan versi ini sebagai versi kontrol di Titik Akhir atau tidak. Default ke False.

cpu_cores_limit
float
nilai default: None

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit
float
nilai default: None

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

Pengecualian