Referenční informace ke konfiguraci clusteru Kubernetes pro Azure Machine Learning
Tento článek obsahuje referenční informace pro konfiguraci Kubernetes pomocí služby Azure Machine Učení.
Podporovaná verze a oblast Kubernetes
Clustery Kubernetes, které instalují rozšíření Azure Machine Učení, mají okno podpory verzí "N-2", které je v souladu se zásadami podpory verzí služby Azure Kubernetes Service (AKS), kde N je nejnovější podverze GA služby Azure Kubernetes Service.
Pokud například AKS dnes zavádí verzi 1.20.a, jsou podporovány verze 1.20.a, 1.20.b, 1.19.c, 1.19.d, 1.18.e a 1.18.f.
Pokud zákazníci používají nepodporovanou verzi Kubernetes, při žádosti o podporu clusteru se zobrazí výzva k upgradu. Clustery s nepodporovanými verzemi Kubernetes se nevztahují na zásady podpory rozšíření Azure Machine Učení.
Dostupnost oblasti rozšíření Azure Machine Učení:
- Rozšíření Azure Machine Učení je možné nasadit do AKS nebo Kubernetes s podporou Azure Arc v podporovaných oblastech uvedených v oblasti Kubernetes s podporou Azure Arc.
Doporučené plánování zdrojů
Když nasadíte rozšíření Azure Machine Učení, některé související služby se nasadí do clusteru Kubernetes pro službu Azure Machine Učení. Následující tabulka uvádí související služby a jejich využití prostředků v clusteru:
Nasazení nebo démon | Replika # | Školení | Odvozování | Žádost o procesor (m) | Limit procesoru (m) | Žádost o paměť (Mi) | Limit paměti (Mi) |
---|---|---|---|---|---|---|---|
metrics-controller-manager | 0 | ✓ | ✓ | 10 | 100 | 20 | 300 |
Operátor Prometheus | 0 | ✓ | ✓ | 100 | 400 | 128 | 512 |
Prometheus | 0 | ✓ | ✓ | 100 | 1000 | 512 | 4096 |
kube-state-metrics | 0 | ✓ | ✓ | 10 | 100 | 32 | 256 |
brána | 0 | ✓ | ✓ | 50 | 500 | 256 | 2048 |
fluent-bit | 1 na uzel | ✓ | ✓ | 10 | 200 | 100 | 300 |
inference-operator-controller-manager | 0 | ✓ | – | 100 | 1000 | 128 | 1024 |
amlarc-identity-controller | 0 | ✓ | – | 200 | 1000 | 200 | 1024 |
amlarc-identity-proxy | 0 | ✓ | – | 200 | 1000 | 200 | 1024 |
azureml-ingress-nginx-controller | 0 | ✓ | – | 100 | 1000 | 64 | 512 |
azureml-fe-v2 | 1 (pro účely testování) nebo 3 (pro účely výroby) |
✓ | – | 900 | 2000 | 800 | 1200 |
online nasazení | 1 na nasazení | Vytvořené uživatelem | – | <user-define> | <user-define> | <user-define> | <user-define> |
online nasazení / identita – sajdkárna | 1 na nasazení | ✓ | – | 10 | 50 | 100 | 100 |
aml-operator | 0 | – | ✓ | 20 | 1020 | 124 | 2168 |
vstup do sopek | 0 | – | ✓ | 10 | 100 | 64 | 256 |
kontroler sopek | 0 | – | ✓ | 50 | 500 | 128 | 512 |
vulkán | 0 | – | ✓ | 50 | 500 | 128 | 512 |
S výjimkou vlastních nasazení/podů jsou celkové minimální požadavky na systémové prostředky následující:
Scénář | Povolené odvození | Povolené trénování | Žádost o procesor (m) | Limit procesoru (m) | Žádost o paměť (Mi) | Limit paměti (Mi) | Počet uzlů | Doporučená minimální velikost virtuálního počítače | Odpovídající skladová položka virtuálního počítače AKS |
---|---|---|---|---|---|---|---|---|---|
Pro testování | ✓ | – | 1780 | 8300 | 2440 | 12296 | 1 Uzel | 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW | DS2v2 |
Pro testování | – | ✓ | 410 | 4420 | 1492 | 10960 | 1 Uzel | 2 vCPU, 7 GiB Paměť, 6400 IOPS, 1500 Mb/s BW | DS2v2 |
Pro testování | ✓ | ✓ | 1910 | 10420 | 2884 | 15744 | 1 Uzel | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS3v2 |
Pro produkční prostředí | ✓ | – | 3600 | 12700 | 4240 | 15296 | 3 uzly | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS3v2 |
Pro produkční prostředí | – | ✓ | 410 | 4420 | 1492 | 10960 | 1 uzly | 8 vCPU, 28GiB Memroy, 25600 IOPs, 6000Mbps BW | DS4v2 |
Pro produkční prostředí | ✓ | ✓ | 3730 | 14820 | 4684 | 18744 | 3 uzly | 4 vCPU, 14 GiB Memory, 12800 IOPS, 1500Mbps BW | DS4v2 |
Poznámka:
- Pro účely testování byste měli odkazovat na požadavek na prostředek tp.
- Pro produkční účely byste měli odkazovat na limit prostředků.
Důležité
Tady je několik dalších aspektů, které je potřeba vzít v úvahu:
- Pro vyšší šířku pásma sítě a lepší výkon vstupně-výstupních operací disku doporučujeme větší skladovou položku.
- Vezměte například DV2/DSv2. Použití velké skladové položky může zkrátit dobu načítání image, aby se zlepšil výkon sítě a úložiště.
- Další informace o rezervaci AKS najdete v rezervaci AKS.
- Pokud používáte cluster AKS, možná budete muset zvážit omezení velikosti image kontejneru v AKS. Další informace najdete v limitu velikosti image kontejneru AKS.
Požadavky pro clustery ARO nebo OCP
Zakázání rozšířeného zabezpečení Linuxu (SELinux)
Datová sada azure machine Učení (funkce sady SDK v1 používaná v úlohách trénování azure machine Učení) není podporovaná na počítačích s povolenou funkcí SELinux. Proto je potřeba zakázat selinux
u všech pracovních procesů, aby bylo možné používat datovou sadu azure Machine Učení.
Privilegované nastavení pro ARO a OCP
Pro nasazení rozšíření Azure Machine Učení v clusteru ARO nebo OCP udělte privilegovaný přístup k účtům služby Azure Machine Učení, spusťte oc edit scc privileged
příkaz a do části Uživatelé přidejte následující účty služeb:
system:serviceaccount:azure-arc:azure-arc-kube-aad-proxy-sa
system:serviceaccount:azureml:{EXTENSION-NAME}-kube-state-metrics
system:serviceaccount:azureml:prom-admission
system:serviceaccount:azureml:default
system:serviceaccount:azureml:prom-operator
system:serviceaccount:azureml:load-amlarc-selinux-policy-sa
system:serviceaccount:azureml:azureml-fe-v2
system:serviceaccount:azureml:prom-prometheus
system:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
system:serviceaccount:azureml:azureml-ingress-nginx
system:serviceaccount:azureml:azureml-ingress-nginx-admission
Poznámka:
{EXTENSION-NAME}
: je název rozšíření zadaný příkazem rozhraní příkazovéhoaz k8s-extension create --name
řádku.{KUBERNETES-COMPUTE-NAMESPACE}
: je obor názvů výpočetních prostředků Kubernetes zadaný při připojování výpočetních prostředků k pracovnímu prostoru Azure Machine Učení. Přeskočtesystem:serviceaccount:{KUBERNETES-COMPUTE-NAMESPACE}:default
konfiguraci, pokudKUBERNETES-COMPUTE-NAMESPACE
jedefault
.
Shromažďované podrobnosti protokolu
Některé protokoly o úlohách Azure Machine Učení v clusteru se shromažďují prostřednictvím komponent rozšíření, jako je stav, metriky, životní cyklus atd. Následující seznam obsahuje všechny shromážděné podrobnosti protokolu, včetně typu shromážděných protokolů a jejich odeslání nebo uložení.
Pod | Popis prostředků | Podrobné informace o protokolování |
---|---|---|
amlarc-identity-controller | Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity | Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity pro koncové body pro ověření pomocí služby Azure Machine Učení. |
amlarc-identity-proxy | Vyžádání a obnovení tokenu Azure Blob nebo Azure Container Registry prostřednictvím spravované identity | Používá se pouze v případech, kdy enableInference=true je nastavena při instalaci rozšíření. Obsahuje protokoly trasování stavu získání identity clusteru pro ověření pomocí služby Azure Machine Učení. |
aml-operator | Správa životního cyklu trénovacích úloh | Protokoly obsahují stav podu trénovací úlohy Azure Machine Učení v clusteru. |
azureml-fe-v2 | Front-endová komponenta, která směruje příchozí požadavky na odvození do nasazených služeb. | Přístupové protokoly na úrovni žádosti, včetně ID požadavku, času spuštění, kódu odpovědi, podrobností o chybě a doby trvání latence požadavku. Protokoly trasování pro změny metadat služby, stav v pořádku služby atd. pro účely ladění. |
brána | Brána se používá ke komunikaci a odesílání dat zpět a zpět. | Trasování protokolů požadavků ze služeb Azure Machine Učení do clusterů |
kontrola stavu | -- | Protokoly obsahují azureml stav prostředku oboru názvů (rozšíření Azure Machine Učení), abyste mohli diagnostikovat, co rozšíření nefunguje. |
inference-operator-controller-manager | Správa životního cyklu koncových bodů odvozování | Protokoly obsahují azure machine Učení stav koncového bodu odvozování a stavu podu nasazení v clusteru. |
metrics-controller-manager | Správa konfigurace pro Prometheus | Trasování protokolů pro stav nahrávání trénovacích úloh a odvozování metrik nasazení o využití procesoru a využití paměti. |
relay server | Přenosový server je potřeba jenom v clusteru připojeném k arc a nebude nainstalován v clusteru AKS. | Relay server spolupracuje se službou Azure Relay ke komunikaci s cloudovými službami. Protokoly obsahují informace o úrovni požadavků z Azure Relay. |
Úlohy Učení Azure Machine se připojují s vlastním úložištěm dat
Trvalý svazek (PV) a trvalá deklarace identity svazku (PVC) jsou koncepty Kubernetes, které uživatelům umožňují poskytovat a využívat různé prostředky úložiště.
- Vytvoření SOUČHODNOTy, například nfs
apiVersion: v1
kind: PersistentVolume
metadata:
name: nfs-pv
spec:
capacity:
storage: 1Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
storageClassName: ""
nfs:
path: /share/nfs
server: 20.98.110.84
readOnly: false
- Vytvořte PVC ve stejném oboru názvů Kubernetes s úlohami ML. V
metadata
nástroji Azure Machine Učení musíte přidat popisekml.azure.com/pvc: "true"
, který bude rozpoznán, a přidat poznámkuml.azure.com/mountpath: <mount path>
pro nastavení cesty připojení.
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: nfs-pvc
namespace: default
labels:
ml.azure.com/pvc: "true"
annotations:
ml.azure.com/mountpath: "/mnt/nfs"
spec:
storageClassName: ""
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
Důležité
- Vlastní úložiště dat z PVC podporují pouze příkazová úloha/komponenta, úloha nebo komponenta hyperdrivu a dávkové nasazení. > * Online koncový bod v reálném čase, úloha AutoML a úloha PRS nepodporují vlastní úložiště dat z PVC.
- Kromě toho se ke svazku připojí jenom pody ve stejném oboru názvů Kubernetes s PVC. Datový vědec má přístup k
mount path
zadanému v poznámce PVC v úloze. Úloha AutoML a úloha Prs nebudou mít přístup k PVC.
Podporované vady a tolerance služby Azure Machine Learning
Taint a Toleration jsou koncepty Kubernetes, které spolupracují, aby se zajistilo, že pody nejsou naplánované na nevhodné uzly.
Clustery Kubernetes integrované se službou Azure Machine Učení (včetně clusterů AKS a Arc Kubernetes) teď podporují specifické tainty a tointy azure machine Učení a tolerance, což uživatelům umožňuje přidávat konkrétní tainty azure machine Učení na uzlech azure Učení vyhrazených uzlů, aby zabránili Učení počítačů mimo Azure. úlohy, které se neplánují na tyto vyhrazené uzly.
Podporujeme pouze umístění taintů specifických pro amlarc na uzly, které jsou definovány takto:
Nakazit | Key | Hodnota | Účinnost | Popis |
---|---|---|---|---|
amlarc overall | ml.azure.com/amlarc | true | NoSchedule nebo NoExecute PreferNoSchedule |
Všechny úlohy azure machine Učení, včetně podů služeb systému rozšíření a podů úloh strojového učení, by tento amlarc overall taint tolerovat. |
systém amlarc | ml.azure.com/amlarc-system | true | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc system pouze pody systému rozšíření Azure Machine Učení. |
Amlarc – úloha | ml.azure.com/amlarc-workload | true | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc workload pouze pody úloh strojového učení. |
amlarc – skupina prostředků | ml.azure.com/resource-group | <název skupiny prostředků> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc resource group pouze pody úloh strojového učení vytvořené z konkrétní skupiny prostředků. |
Pracovní prostor amlarc | ml.azure.com/workspace | <název pracovního prostoru> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc workspace pouze pody úloh strojového učení vytvořené z konkrétního pracovního prostoru. |
amlarc compute | ml.azure.com/compute | <název výpočetních prostředků> | NoSchedule nebo NoExecute PreferNoSchedule |
Tento taint by toleroval amlarc compute pouze pody úloh strojového učení vytvořené s konkrétním cílovým výpočetním objektem. |
Tip
- V případě služby Azure Kubernetes Service (AKS) můžete postupovat podle příkladu v části Osvědčené postupy pro pokročilé funkce plánovače ve službě Azure Kubernetes Service (AKS), které použijí tainty na fondy uzlů.
- U clusterů Arc Kubernetes, jako jsou místní clustery Kubernetes, můžete pomocí
kubectl taint
příkazu přidat tainty do uzlů. Další příklady najdete v dokumentaci k Kubernetes.
Osvědčené postupy
Podle požadavků na plánování uzlů azure machine Učení vyhrazených uzlů můžete přidat několik taintů specifických pro amlarc, abyste omezili, jaké úlohy Azure Machine Učení můžou běžet na uzlech. Uvádíme osvědčené postupy pro používání taintů amlarc:
- Pokud chcete zabránit spuštění úloh mimo Azure machine Učení na počítačích Azure Učení vyhrazených uzlech nebo fondech uzlů, stačí do těchto uzlů přidat
aml overall
taint. - Pokud chcete zabránit spuštění podů mimo systém na počítačích Azure Učení vyhrazených uzlech nebo fondech uzlů, musíte přidat následující tainty:
amlarc overall
Nakazitamlarc system
Nakazit
- Pokud chcete zabránit tomu, aby úlohy bez ml běžely na počítačích Azure Učení vyhrazených uzlech nebo fondech uzlů, musíte přidat následující tainty:
amlarc overall
Nakazitamlarc workloads
Nakazit
- Pokud chcete zabránit tomu, aby úlohy vytvořené z pracovního prostoru X běžely na počítačích Azure Učení vyhrazených uzlech nebo fondech uzlů, musíte přidat následující tainty:
amlarc overall
Nakazitamlarc resource group (has this <workspace X>)
Nakazitamlarc <workspace X>
Nakazit
- Pokud chcete zabránit tomu, aby úlohy vytvořené cílovým výpočetním objektem X běžely na počítačích Azure Učení vyhrazených uzlech nebo fondech uzlů, musíte přidat následující tainty:
amlarc overall
Nakazitamlarc resource group (has this <workspace X>)
Nakazitamlarc workspace (has this <compute X>)
Nakazitamlarc <compute X>
Nakazit
Integrace dalšího kontroleru příchozího přenosu dat s rozšířením Azure Machine Učení přes PROTOKOL HTTP nebo HTTPS
Kromě výchozího nástroje azure machine Učení odvozování nástroje pro vyrovnávání zatížení azureml-fe můžete také integrovat další nástroje pro vyrovnávání zatížení se službou Azure Machine Učení rozšířením přes PROTOKOL HTTP nebo HTTPS.
Tento kurz ukazuje, jak integrovat kontroler příchozího přenosu dat Nginx nebo bránu Aplikace Azure.
Požadavky
- Nasaďte rozšíření Azure Machine Učení a
inferenceRouterServiceType=ClusterIP
allowInsecureConnections=True
, aby kontroler příchozího přenosu dat Nginx mohl zpracovávat ukončení protokolu TLS sám o sobě, místo aby ho předával službě azureml-fe, když je služba vystavená přes PROTOKOL HTTPS. - K integraci s kontrolerem příchozího přenosu dat Nginx potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat Nginx.
- Vytvořte základní kontroler: Pokud začínáte úplně od začátku, přečtěte si tyto pokyny.
- K integraci se službou Aplikace Azure Gateway potřebujete nastavení clusteru Kubernetes s kontrolerem příchozího přenosu dat brány Aplikace Azure.
- Pokud chcete pro tuto aplikaci použít https, potřebujete certifikát x509 a jeho privátní klíč.
Zveřejnění služeb přes PROTOKOL HTTP
K zveřejnění azureml-fe použijeme následující prostředek příchozího přenosu dat:
# Nginx Ingress Controller example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: nginx
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
Tento příchozí přenos dat zpřístupňuje azureml-fe
službu a vybrané nasazení jako výchozí back-end kontroleru příchozího přenosu dat Nginx.
# Azure Application Gateway example
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
name: azureml-fe
namespace: azureml
spec:
ingressClassName: azure-application-gateway
rules:
- http:
paths:
- path: /
backend:
service:
name: azureml-fe
port:
number: 80
pathType: Prefix
Tento příchozí přenos dat zpřístupňuje azureml-fe
službu a vybrané nasazení jako výchozí back-end služby Application Gateway.
Uložte výše uvedený prostředek příchozího přenosu dat jako ing-azureml-fe.yaml
.
Nasazení
ing-azureml-fe.yaml
spuštěním příkazu:kubectl apply -f ing-azureml-fe.yaml
Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.
azureml-fe
Aplikace by teď měla být dostupná. Můžete to zkontrolovat na adrese:- Kontroler příchozího přenosu dat Nginx: veřejná adresa loadbalanceru kontroleru příchozího přenosu dat Nginx
- Aplikace Azure Gateway: veřejná adresa služby Application Gateway.
Vytvořte úlohu odvození a vyvolejte ji.
Poznámka:
Před vyvoláním nahraďte IP adresu v scoring_uri veřejnou adresou LoadBalanceru kontroleru příchozího přenosu dat Nginx.
Zveřejnění služeb přes HTTPS
Před nasazením příchozího přenosu dat je potřeba vytvořit tajný klíč Kubernetes pro hostování certifikátu a privátního klíče. Tajný kód Kubernetes můžete vytvořit spuštěním příkazu .
kubectl create secret tls <ingress-secret-name> -n azureml --key <path-to-key> --cert <path-to-cert>
Definujte následující příchozí přenos dat. V příchozím přenosu dat zadejte název tajného kódu v oddílu
secretName
.# Nginx Ingress Controller example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: nginx tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
# Azure Application Gateway example apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: azureml-fe namespace: azureml spec: ingressClassName: azure-application-gateway tls: - hosts: - <domain> secretName: <ingress-secret-name> rules: - host: <domain> http: paths: - path: / backend: service: name: azureml-fe port: number: 80 pathType: Prefix
Poznámka:
<ingress-secret-name>
Ve výše uvedeném prostředku příchozího přenosu dat nahraďte<domain>
doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway a názvem vašeho tajného kódu. Uložte výše uvedený prostředek příchozího přenosu dat do názvuing-azureml-fe-tls.yaml
souboru .Nasazení ing-azureml-fe-tls.yaml spuštěním příkazu
kubectl apply -f ing-azureml-fe-tls.yaml
Zkontrolujte stav nasazení v protokolu kontroleru příchozího přenosu dat.
azureml-fe
Aplikace je teď dostupná na https. Můžete to zkontrolovat tak, že navštívíte veřejnou adresu LoadBalanceru kontroleru příchozího přenosu dat Nginx.Vytvořte úlohu odvození a vyvolejte ji.
Poznámka:
Před vyvoláním příkazu nahraďte protokol a IP adresu v scoring_uri https a doménou odkazující na LoadBalancer kontroleru příchozího přenosu dat Nginx nebo služby Application Gateway.
Nasazení rozšíření s využitím šablony ARM
Rozšíření ve spravovaném clusteru je možné nasadit pomocí šablony ARM. Ukázkovou šablonu najdete z souboru deployextension.json s ukázkovým souborem parametrů deployextension.parameters.json.
Pokud chcete použít ukázkovou šablonu nasazení, upravte soubor parametrů se správnou hodnotou a spusťte následující příkaz:
az deployment group create --name <ARM deployment name> --resource-group <resource group name> --template-file deployextension.json --parameters deployextension.parameters.json
Další informace o používání šablony ARM najdete v dokumentaci k šabloně ARM.
Poznámka k vydání rozšíření AzuremML
Poznámka:
Nové funkce se vydávají v biweekly kalendáři.
Datum | Verze | Popis verze |
---|---|---|
21. listopadu 2023 | 1.1.39 | Opravili jsme chyby zabezpečení. Upřesňující chybová zpráva Zvýšená stabilita pro rozhraní API přenosového serveru |
1. listopadu 2023 | 1.1.37 | Aktualizace verze envoy roviny dat |
11. října 2023 | 1.1.35 | Opravte ohrožený obrázek. Opravy chyb. |
Aug 25, 2023 | 1.1.34 | Opravte ohrožený obrázek. Vrátí podrobnější chybu identity. Opravy chyb. |
18. července 2023 | 1.1.29 | Přidání chyb nového operátoru identity Opravy chyb. |
4. června 2023 | 1.1.28 | Vylepšení automatického škálování pro zpracování více fondů uzlů Opravy chyb. |
Duben 18 , 2023 | 1.1.26 | Opravili jsme opravy chyb a chyby zabezpečení. |
27. března 2023 | 1.1.25 | Přidání omezení úlohy Učení Azure Machine Rychlé selhání pro trénovací úlohu, když se instalace SSH nezdařila. Snižte interval výstřižku Prometheus na 30s. Zlepšení chybových zpráv pro odvozování Opravte ohrožený obrázek. |
7. března 2023 | 1.1.23 | Změňte výchozí typ instance tak, aby používal paměť 2Gi. Aktualizujte konfigurace metrik pro bodování fe, které přidávají 15s scrape_interval. Přidejte specifikaci prostředku pro mdc sidecar. Opravte ohrožený obrázek. Opravy chyb. |
14. února 2023 | 1.1.21 | Opravy chyb. |
7. února 2023 | 1.1.19 | Zlepšení chybové návratové zprávy pro odvozování Aktualizujte výchozí typ instance tak, aby používal limit paměti 2Gi. Zkontrolujte stav podu, kvótu prostředků, verzi Kubernetes a verzi rozšíření. Opravy chyb |
Prosinec 27, 2022 | 1.1.17 | Přesuňte fluent-bit z DaemonSet na sajdkáře. Přidejte podporu MDC. Upřesněte chybové zprávy. Podpora úloh v režimu clusteru (Windows, Linux) Opravy chyb |
29. listopadu 2022 | 1.1.16 | Přidejte ověření typu instance podle nového CRD. Odolnost proti podpoře. Zkraťte název SVC. Hodina jádra úlohy Opravy a vylepšení několika chyb |
13. zář 2022 | 1.1.10 | Opravy chyb. |
Aug 29, 2022 | 1.1.9 | Vylepšená logika kontroly stavu Opravy chyb. |
23. června 2022 | 1.1.6 | Opravy chyb. |
15. června 2022 | 1.1.5 | Aktualizace trénování pro použití nového běžného modulu runtime ke spouštění úloh Odebrání využití Služby Azure Relay pro rozšíření AKS Odebrání využití služby Service Bus z rozšíření Aktualizované využití kontextu zabezpečení Aktualizace odvození azureml-fe na verzi 2 Aktualizováno tak, aby používala volcano jako plánovač trénovacích úloh. Opravy chyb. |
14. října 2021 | 1.0.37 | Podpora připojení svazku PV/PVC v trénovací úloze AMLArc |
16. září 2021 | 1.0.29 | Dostupné nové oblasti, WestUS, CentralUS, NorthCentralUS, KoreaCentral. Rozšiřitelnost fronty úloh Podívejte se na podrobnosti o frontě úloh v nástroji Azure Machine Učení Workspace Studio. Automatická vražda politiky. Podpora max_run_duration_seconds v ScriptRunConfig. Systém se pokusí spuštění automaticky zrušit, pokud trvalo déle, než je hodnota nastavení. Vylepšení výkonu u podpory automatického škálování clusteru Nasazení agenta Arc a rozšíření ML z místního registru kontejneru |
24. srpna 2021 | 1.0.28 | Typ výpočetní instance je podporován v jazyce YAML úlohy. Přiřaďte spravovanou identitu výpočetním prostředkům AMLArc. |
10. srpna 2021 | 1.0.20 | Nová podpora distribuce Kubernetes, K3S – Lightweight Kubernetes Nasaďte rozšíření Azure Machine Učení do clusteru AKS bez připojení přes Azure Arc. Automatizované strojové Učení (AutoML) prostřednictvím sady Python SDK. Pomocí rozhraní příkazového řádku 2.0 připojte cluster Kubernetes k pracovnímu prostoru Učení Azure Machine. Optimalizace využití prostředků procesoru a paměti komponent rozšíření Azure Machine Učení |
2. července 2021 | 1.0.13 | Podpora nových distribucí Kubernetes, OpenShift Kubernetes a GKE (Google Kubernetes Engine). Podpora automatického škálování Pokud cluster Kubernetes spravovaný uživatelem povolí automatické škálování, cluster se automaticky škáluje nebo škáluje podle objemu aktivních spuštění a nasazení. Zlepšení výkonu u spouštěče úloh, které zkracuje dobu provádění úlohy na hodně. |
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro