azureml.core.webservice.aks.AksServiceDeploymentConfiguration class - Azure Machine Learning Python

cpu_cores_limit

Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit

Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

autoscale_enabled: bool

Diperlukan

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas: int

Diperlukan

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas: int

Diperlukan

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds: int

Diperlukan

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization: int

Diperlukan

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data: bool

Diperlukan

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled: bool

Diperlukan

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores: float

Diperlukan

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb: float

Diperlukan

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights: bool

Diperlukan

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms: int

Diperlukan

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests: int

Diperlukan

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time: int

Diperlukan

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas: int

Diperlukan

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key: str

Diperlukan

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key: str

Diperlukan

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags: dict[str, str]

Diperlukan

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties: dict[str, str]

Diperlukan

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description: str

Diperlukan

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores: int

Diperlukan

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds: int

Diperlukan

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds: int

Diperlukan

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds: int

Diperlukan

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold: int

Diperlukan

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold: int

Diperlukan

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace: str

Diperlukan

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled: bool

Diperlukan

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

cpu_cores_limit

Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit

Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled: bool

nilai default: None

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

autoscale_enabled: bool

Diperlukan

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas: int

Diperlukan

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas: int

Diperlukan

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds: int

Diperlukan

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization: int

Diperlukan

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data: bool

Diperlukan

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled: bool

Diperlukan

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores: float

Diperlukan

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb: float

Diperlukan

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights: bool

Diperlukan

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms: int

Diperlukan

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests: int

Diperlukan

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time: int

Diperlukan

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas: int

Diperlukan

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key: str

Diperlukan

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key: str

Diperlukan

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

tags: dict[str, str]

Diperlukan

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

properties: dict[str, str]

Diperlukan

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

description: str

Diperlukan

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores: int

Diperlukan

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds: int

Diperlukan

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds: int

Diperlukan

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds: int

Diperlukan

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold: int

Diperlukan

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold: int

Diperlukan

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

namespace: str

Diperlukan

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled: bool

Diperlukan

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

compute_target_name: str

Diperlukan

Nama target komputasi tujuan penyebaran

cpu_cores_limit: float

Diperlukan

Jumlah maksimum inti cpu yang boleh digunakan oleh Layanan Web ini. Bisa berupa desimal.

memory_gb_limit: float

Diperlukan

Jumlah maksimum memori (dalam GB) yang boleh digunakan oleh Layanan web ini. Bisa berupa desimal.

blobfuse_enabled: bool

Diperlukan

Apakah mengaktifkan blobfuse untuk pengunduhan model untuk Layanan Web ini atau tidak. Default ke True

autoscale_enabled: bool

Menunjukkan apakah akan mengaktifkan penskalaan otomatis untuk Layanan web ini. Defaultnya diatur ke True jika num_replicas adalah None.

autoscale_min_replicas: int

Jumlah minimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Default ke 1.

autoscale_max_replicas: int

Jumlah maksimum kontainer yang digunakan saat penskalaan otomatis Layanan web ini. Defaultnya diatur ke 10

autoscale_refresh_seconds: int

Seberapa sering penskala otomatis harus mencoba menskalakan Layanan web ini. Default ke 1.

autoscale_target_utilization: int

Pemanfaatan target (dalam persen dari 100) penskala otomatis harus berusaha mempertahankan Layanan web ini. Default ke 70.

collect_model_data: bool

Apakah akan mengaktifkan pengumpulan data model untuk Layanan web ini atau tidak. Default ke False.

auth_enabled: bool

Apakah akan mengaktifkan auth untuk Layanan web ini atau tidak. Default ke True.

cpu_cores: float

Jumlah inti CPU yang akan dialokasikan untuk Layanan Web ini. Bisa berupa desimal. Default ke 0,1

memory_gb: float

Jumlah memori (dalam GB) yang dialokasikan untuk Layanan web ini. Bisa berupa desimal. Default ke 0,5

enable_app_insights: bool

Apakah akan mengaktifkan pencatatan Application Insights untuk Layanan web ini atau tidak. Default ke False

scoring_timeout_ms: int

Batas waktu untuk memberlakukan mencetak panggilan ke Layanan web ini. Default ke 60000.

replica_max_concurrent_requests: int

Jumlah permintaan bersamaan maksimum per replika untuk memungkinkan Layanan web ini. Default ke 1. Jangan ubah pengaturan ini dari nilai default 1 kecuali diminta oleh Dukungan Teknis Microsoft atau anggota tim Azure Machine Learning.

max_request_wait_time: int

Jumlah maksimum waktu permintaan akan tetap dalam permintaan (dalam milidetik) sebelum menampilkan kesalahan 503. Default ke 500.

num_replicas: int

Jumlah kontainer yang dialokasikan untuk Layanan web ini. Tidak ada default, jika parameter ini tidak diatur maka penskala otomatis akan diaktifkan secara default.

primary_key: str

Kunci autentikasi utama yang digunakan untuk Layanan Web ini.

secondary_key: str

Kunci autentikasi sekunder yang digunakan untuk Layanan Web ini.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Kamus tag nilai kunci untuk memberikan Layanan Web ini.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Kamus properti nilai kunci untuk memberikan Layanan Web ini. Properti ini tidak dapat diubah setelah penyebaran, namun pasangan nilai kunci baru bisa ditambahkan.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Deskripsi untuk diberikan ke Layanan Web ini.

gpu_cores: int

Jumlah inti GPU yang akan dialokasikan untuk Layanan web ini. Default ke 0.

period_seconds: int

Seberapa sering (dalam hitungan detik) untuk melakukan probe keaktifan. Default ke 10 detik. Nilai minimalnya adalah 1.

initial_delay_seconds: int

Jumlah detik setelah kontainer dimulai sebelum probe keaktifan dimulai. Default ke 310.

timeout_seconds: int

Jumlah detik setelah waktu pemeriksaan keaktifan habis. Defaultnya diatur ke 2 detik. Nilai minimalnya adalah 1.

success_threshold: int

Keberhasilan minimum berturut-turut untuk probe keaktifan dianggap berhasil setelah gagal. Default ke 1. Nilai minimalnya adalah 1.

failure_threshold: int

Saat Pod dimulai dan pemeriksaan keaktifan gagal, Kubernetes akan mencoba failureThreshold kali sebelum menyerah. Default ke 3. Nilai minimalnya adalah 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Kumpulan nama XML Kubernetes untuk menyebarkan Layanan web ini: hingga 63 karakter alfanumerik huruf kecil ('a'-'z', '0'-'9') dan tanda hubung ('-'). Karakter pertama dan terakhir tidak boleh berupa tanda hubung.

token_auth_enabled: bool

Apakah akan mengaktifkan autentikasi Azure Active Directory untuk Layanan web ini atau tidak. Jika ini diaktifkan, pengguna dapat mengakses Layanan web ini dengan mengambil token akses menggunakan kredensial Azure Active Directory mereka. Default ke False.

Bagikan melalui

AksServiceDeploymentConfiguration Kelas

Konstruktor

Parameter

Variabel

Metode

print_deploy_configuration

validate_configuration

Pengecualian

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: