AksServiceDeploymentConfiguration Kelas
Mewakili informasi konfigurasi penyebaran untuk layanan yang diterapkan pada Azure Kubernetes Service.
Buat objek AksServiceDeploymentConfiguration menggunakan metode deploy_configuration
dari kelas AksWebservice.
Menginisialisasi objek konfigurasi untuk disebarkan ke target komputasi AKS.
- Warisan
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parameter
- cpu_cores_limit
Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.
- memory_gb_limit
Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.
- autoscale_enabled
- bool
Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini.
Defaultnya diatur ke True jika num_replicas
adalah None.
- autoscale_min_replicas
- int
Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.
- autoscale_max_replicas
- int
Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10
- autoscale_refresh_seconds
- int
Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.
- autoscale_target_utilization
- int
Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.
- collect_model_data
- bool
Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.
- auth_enabled
- bool
Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.
- cpu_cores
- float
Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1
- memory_gb
- float
Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5
- enable_app_insights
- bool
Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False
- scoring_timeout_ms
- int
Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.
- replica_max_concurrent_requests
- int
Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.
- max_request_wait_time
- int
Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.
- num_replicas
- int
Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.
Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.
- gpu_cores
- int
Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.
- period_seconds
- int
Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.
- initial_delay_seconds
- int
Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.
- timeout_seconds
- int
Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.
- success_threshold
- int
Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.
- failure_threshold
- int
Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold
kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.
- namespace
- str
Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.
- token_auth_enabled
- bool
Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.
- cpu_cores_limit
Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.
- memory_gb_limit
Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.
- blobfuse_enabled
- bool
Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True
- autoscale_enabled
- bool
Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini.
Defaultnya diatur ke True jika num_replicas
adalah None.
- autoscale_min_replicas
- int
Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.
- autoscale_max_replicas
- int
Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10
- autoscale_refresh_seconds
- int
Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.
- autoscale_target_utilization
- int
Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.
- collect_model_data
- bool
Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.
- auth_enabled
- bool
Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.
- cpu_cores
- float
Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1
- memory_gb
- float
Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5
- enable_app_insights
- bool
Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False
- scoring_timeout_ms
- int
Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.
- replica_max_concurrent_requests
- int
Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.
- max_request_wait_time
- int
Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.
- num_replicas
- int
Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.
Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.
- gpu_cores
- int
Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.
- period_seconds
- int
Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.
- initial_delay_seconds
- int
Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.
- timeout_seconds
- int
Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.
- success_threshold
- int
Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.
- failure_threshold
- int
Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold
kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.
- namespace
- str
Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.
- token_auth_enabled
- bool
Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.
- cpu_cores_limit
- float
Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.
- memory_gb_limit
- float
Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.
- blobfuse_enabled
- bool
Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True
Variabel
- autoscale_enabled
- bool
Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini.
Defaultnya diatur ke True jika num_replicas
adalah None.
- autoscale_min_replicas
- int
Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.
- autoscale_max_replicas
- int
Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10
- autoscale_refresh_seconds
- int
Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.
- autoscale_target_utilization
- int
Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.
- collect_model_data
- bool
Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.
- auth_enabled
- bool
Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.
- cpu_cores
- float
Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1
- memory_gb
- float
Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5
- enable_app_insights
- bool
Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False
- scoring_timeout_ms
- int
Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.
- replica_max_concurrent_requests
- int
Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.
- max_request_wait_time
- int
Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.
- num_replicas
- int
Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.
- primary_key
- str
Kunci autentikasi utama yang digunakan untuk Layanan Web ini.
- secondary_key
- str
Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Kamus tag nilai kunci untuk memberikan Layanan Web ini.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Deskripsi untuk diberikan ke Layanan Web ini.
- gpu_cores
- int
Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.
- period_seconds
- int
Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.
- initial_delay_seconds
- int
Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.
- timeout_seconds
- int
Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.
- success_threshold
- int
Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.
- failure_threshold
- int
Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold
kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.
- token_auth_enabled
- bool
Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.
Metode
print_deploy_configuration |
Cetak konfigurasi penyebaran. |
validate_configuration |
Periksa apakah nilai konfigurasi yang ditentukan valid. Akan memunculkan WebserviceException jika validasi gagal. |
print_deploy_configuration
Cetak konfigurasi penyebaran.
print_deploy_configuration()
validate_configuration
Periksa apakah nilai konfigurasi yang ditentukan valid.
Akan memunculkan WebserviceException jika validasi gagal.
validate_configuration()
Pengecualian
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk