Pracovní prostory Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-06-01-preview
Definice prostředku Bicep
Typ prostředku workspaces/onlineEndpoints/deployments je možné nasadit s operacemi, které cílí na:
- Skupiny prostředků – viz příkazy nasazení skupiny prostředků.
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující bicep.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objekty OnlineDeploymentProperties
Nastavte vlastnost endpointComputeType pro určení typu objektu.
Pro Kubernetes použijte:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
V případě spravovaného použijte:
endpointComputeType: 'Managed'
Objekty OnlineScaleSettings
Nastavte vlastnost scaleType a určete typ objektu.
Jako Výchozí použijte:
scaleType: 'Default'
V části TargetUtilization (Využití cíle) použijte:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Hodnoty vlastností
pracovní prostory/online koncové body/nasazení
Název | Description | Hodnota |
---|---|---|
name | Název prostředku Přečtěte si, jak nastavit názvy a typy pro podřízené prostředky v Bicepu. |
string (povinné) |
location | Geografické umístění, ve kterém se nachází prostředek | string (povinné) |
tags | Značky prostředků. | Slovník názvů značek a hodnot. Viz Značky v šablonách |
Sku | Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování | Sku |
Druhu | Metadata používaná portálem, nástroji atd. k vykreslení různých uživatelských prostředí pro prostředky stejného typu. | řetězec |
Nadřazené | V nástroji Bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost stačí přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek. Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek. |
Symbolický název prostředku typu: onlineEndpoints |
identity | Identita spravované služby (identity přiřazené systémem nebo uživatelem) | ManagedServiceIdentity |
properties | [Povinné] Další atributy entity. | OnlineDeploymentProperties (povinné) |
ManagedServiceIdentity
Název | Description | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). | 'Žádný' 'SystemAssigned' 'SystemAssigned,UserAssigned' UserAssigned (povinné) |
userAssignedIdentity | Sada identit přiřazených uživatelem přidružených k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formátu /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | UserAssignedIdentities |
UserAssignedIdentities
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | UserAssignedIdentity |
UserAssignedIdentity
Tento objekt neobsahuje žádné vlastnosti, které by se nastavily během nasazování. Všechny vlastnosti jsou Jen pro čtení.
OnlineDeploymentProperties
Název | Description | Hodnota |
---|---|---|
appInsightsEnabled | Pokud ano, povolí protokolování Application Insights. | bool |
codeConfiguration | Konfigurace kódu pro nasazení koncového bodu | Konfigurace kódu |
dataCollector | V konfiguraci mdc zakážeme mdc, když má hodnotu null. | DataCollector |
description | Popis nasazení koncového bodu | řetězec |
výchozí přenos datPublicNetworkAccess | Pokud je povoleno, povolte výchozí přenos dat z veřejné sítě. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | Zakázáno Povoleno |
id prostředí | ID prostředku ARM specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
typ instance | Typ výpočetní instance. | řetězec |
livenessProbe | Sonda aktivity pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu ve vlastním kontejneru. | řetězec |
properties | Slovník vlastností. Vlastnosti se dají přidat, ale ne odebrat ani změnit. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Sonda připravenosti ověřuje, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako u sondy aktivity. | ProbeSettings |
requestSettings | Nastavení požadavku pro nasazení. | OnlineRequestSettings |
škálovací nastavení | Nastavení škálování pro nasazení. Pokud je hodnota null nebo není zadána, Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a na DefaultScaleSettings pro ManagedOnlineDeployment. |
OnlineScaleSettings |
typcompute_koncového bodu | Nastavení typu objektu | Kubernetes Spravované (povinné) |
CodeConfiguration
Název | Description | Hodnota |
---|---|---|
id kódu | ID prostředku ARM prostředku kódu. | řetězec |
scoringScript | [Povinné] Skript, který se má spustit při spuštění. např. "score.py" | string (povinné) Omezení: Minimální délka = 1 Vzor = [a-zA-Z0-9_] |
DataCollector
Název | Description | Hodnota |
---|---|---|
Sbírky | [Povinné] Konfigurace kolekce. Každá kolekce má vlastní konfiguraci pro shromažďování dat modelu a název kolekce může být libovolný řetězec. Kolektor dat modelu se dá použít pro protokolování datové části, vlastní protokolování nebo obojí. Požadavky a odpovědi na kolekci jsou vyhrazené pro protokolování datové části, jiné pro vlastní protokolování. |
DataCollectorCollections (povinné) |
requestLogging | Konfigurace protokolování požadavků pro mdc zahrnuje upřesňující nastavení protokolování pro všechny kolekce. Zpráva není povinná. | Protokolování požadavků |
rollingRate | Když se data modelu shromažďují do úložiště objektů blob, musíme je převést na jinou cestu, abychom se vyhnuli jejich protokolování do jednoho souboru objektu blob. Pokud je sazba hodinová, všechna data se shromáždí v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je tento den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou posuvné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat. |
'Den' Hodina 'Minuta' 'Month' 'Year' |
DataCollectorCollections
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | Kolekce |
Kolekce
Název | Description | Hodnota |
---|---|---|
clientId | ID klienta MSI použité ke shromažďování protokolování do úložiště objektů blob. Pokud má hodnotu null, back-end vybere pro ověření identitu registrovaného koncového bodu. | řetězec |
dataCollectionMode | Povolte nebo zakažte shromažďování dat. | Zakázáno 'Povoleno' |
id data | ID prostředku ARM datového assetu. Na straně klienta se zajistí, že datový prostředek ukazuje na úložiště objektů blob a back-end bude shromažďovat data do úložiště objektů blob. | řetězec |
vzorkovací rychlost | Vzorkovací frekvence pro kolekci. Vzorkovací frekvence 1.0 znamená, že ve výchozím nastavení shromažďujeme 100 % dat. | int |
Protokolování požadavků
Název | Description | Hodnota |
---|---|---|
captureHeaders | Pro protokolování datové části shromažďujeme ve výchozím nastavení jenom datovou část. Pokud zákazníci chtějí také shromažďovat zadané hlavičky, mohou je nastavit v captureHeaders tak, aby back-end shromažďoval tyto hlavičky spolu s datovou částí. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
ProbeSettings
Název | Description | Hodnota |
---|---|---|
failureThreshold | Počet selhání, která se mají povolit před vrácením stavu, který není v pořádku. | int |
Initialdelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
period | Délka doby mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | int |
timeout | Časový limit sondy ve formátu ISO 8601 | řetězec |
EndpointDeploymentPropertiesBaseVlastnosti
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
OnlineRequestSettings
Název | Description | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Maximální povolený počet souběžných požadavků na jeden uzel na nasazení. Výchozí hodnota je 1. | int |
maxQueueWait | Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500ms. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601 Výchozí hodnota je 5000ms. |
řetězec |
OnlineScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | Nastavení typu objektu | Default TargetUtilization (povinné) |
DefaultScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | Výchozí (povinné) |
TargetUtilizationScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | TargetUtilization (povinné) |
maxInstances | Maximální počet instancí, na které může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | int |
minInstances | Minimální počet instancí, které se mají vždy vyskytovat. | int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností na sekundy. | řetězec |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | int |
Nasazení KubernetesOnlineDeployment
Název | Description | Hodnota |
---|---|---|
typcompute_koncového bodu | [Povinné] Typ výpočetních prostředků koncového bodu. | Kubernetes (povinné) |
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
ContainerResourceRequirements
Název | Description | Hodnota |
---|---|---|
kontejnerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o žádosti o prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Název | Description | Hodnota |
---|---|---|
Cpu | Počet požadavků nebo omezení počtu virtuálních procesorů pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet požadavků nebo omezení počtu karet Nvidia GPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek/limit velikosti paměti pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Nasazení ManagedOnlineDeployment
Název | Description | Hodnota |
---|---|---|
typcompute_koncového bodu | [Povinné] Typ výpočetních prostředků koncového bodu. | Spravované (povinné) |
Skladová jednotka (SKU)
Název | Description | Hodnota |
---|---|---|
capacity | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, mělo by být zahrnuto celé číslo kapacity. Pokud pro prostředek není možné škálovat na více nebo více instancí, může se to vynechat. | int |
family | Pokud má služba různé generace hardwaru pro stejnou skladovou položku, můžete to tady zaznamenat. | řetězec |
name | Název skladové položky. Příklad – P3. Obvykle se jedná o písmeno+číselný kód. | string (povinné) |
size | Velikost skladové položky. Pokud je pole pro název kombinací vrstvy a nějaké jiné hodnoty, jedná se o samostatný kód. | řetězec |
tier | Toto pole musí poskytovatel prostředků implementovat, pokud má služba více než jednu úroveň, ale nevyžaduje se u PUT. | 'Základní' 'Zdarma' Premium 'Standardní' |
Definice prostředku šablony ARM
Typ prostředku pracovní prostory/ online koncové body/nasazení je možné nasadit s operacemi, které cílí na:
- Skupiny prostředků – viz příkazy pro nasazení skupin prostředků.
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující kód JSON.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-06-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objekty OnlineDeploymentProperties
Nastavením vlastnosti endpointComputeType zadejte typ objektu.
Pro Kubernetes použijte:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
V případě spravovaného použijte:
"endpointComputeType": "Managed"
Objekty OnlineScaleSettings
Nastavte vlastnost scaleType a určete typ objektu.
Jako Výchozí použijte:
"scaleType": "Default"
V části TargetUtilization (Využití cíle) použijte:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Hodnoty vlastností
pracovní prostory/online koncové body/nasazení
Název | Description | Hodnota |
---|---|---|
typ | Typ prostředku | Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments |
apiVersion | Verze rozhraní API prostředku | 2023-06-01-preview |
name | Název prostředku Podívejte se, jak nastavit názvy a typy pro podřízené prostředky v šablonách JSON ARM. |
string (povinné) |
location | Geografické umístění, kde se prostředek nachází | string (povinné) |
tags | Značky prostředků. | Slovník názvů a hodnot značek. Zobrazit značky v šablonách |
Sku | Podrobnosti o SKU vyžadované pro kontrakt ARM pro automatické škálování | Sku |
Druhu | Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského prostředí pro prostředky stejného typu. | řetězec |
identity | Identita spravované služby (identity přiřazené systémem nebo uživatelem) | Identita spravované služby |
properties | [Povinné] Další atributy entity | OnlineDeploymentProperties (povinné) |
Identita spravované služby
Název | Description | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned) | 'Žádný' 'SystemAssigned' 'SystemAssigned,UserAssigned' UserAssigned (povinné) |
userAssignedIdentity | Sada identit přiřazených uživatelem přidružených k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formátu /subscriptions/{subscriptionId}/resourceGroups/{název_skupiny_prostředků}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | UserAssignedIdentity |
UserAssignedIdentity
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | UserAssignedIdentity |
UserAssignedIdentity
Tento objekt neobsahuje žádné vlastnosti, které by se nastavily během nasazování. Všechny vlastnosti jsou jen pro čtení.
OnlineDeploymentProperties
Název | Description | Hodnota |
---|---|---|
appInsightsEnabled | Pokud je true, povolí protokolování Application Insights. | bool |
codeConfiguration | Konfigurace kódu pro nasazení koncového bodu | CodeConfiguration |
dataCollector | V konfiguraci mdc zakážeme mdc, když má hodnotu null. | DataCollector |
description | Popis nasazení koncového bodu | řetězec |
výchozí přenos datPublicNetworkAccess | Pokud je povoleno, povolte výchozí přenos dat z veřejné sítě. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | Zakázáno Povoleno |
id prostředí | ID prostředku ARM specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
typ instance | Typ výpočetní instance. | řetězec |
livenessProbe | Sonda aktivity pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu ve vlastním kontejneru. | řetězec |
properties | Slovník vlastností. Vlastnosti se dají přidat, ale ne odebrat ani změnit. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Sonda připravenosti ověřuje, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako u sondy aktivity. | ProbeSettings |
requestSettings | Nastavení požadavku pro nasazení. | OnlineRequestSettings |
scaleSettings | Nastavení škálování pro nasazení Pokud je hodnota null nebo není zadá, Výchozí hodnota je TargetUtilizationScaleSettings pro KubernetesOnlineDeployment. a na DefaultScaleSettings pro ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Nastavení typu objektu | Kubernetes Spravované (povinné) |
Konfigurace kódu
Název | Description | Hodnota |
---|---|---|
id kódu | ID prostředku ARM pro prostředek kódu. | řetězec |
scoringScript | [Povinné] Skript, který se má spustit při spuštění. např. "score.py" | string (povinné) Omezení: Minimální délka = 1 Pattern = [a-zA-Z0-9_] |
DataCollector
Název | Description | Hodnota |
---|---|---|
Sbírky | [Povinné] Konfigurace kolekce. Každá kolekce má vlastní konfiguraci pro shromažďování dat modelu a název kolekce může být libovolný řetězec. Kolektor dat modelu se dá použít buď pro protokolování datové části, nebo pro vlastní protokolování, nebo pro obojí. Požadavky a odpovědi na kolekci jsou vyhrazené pro protokolování datové části, jiné pro vlastní protokolování. |
DataCollectorCollections (povinné) |
requestLogging | Konfigurace protokolování požadavků pro mdc zahrnuje upřesňující nastavení protokolování pro všechny kolekce. Zpráva není povinná. | Protokolování požadavků |
rollingRate | Když se data modelu shromažďují do úložiště objektů blob, musíme je vrátit do jiné cesty, abychom se vyhnuli protokolování všech dat v jednom souboru objektu blob. Pokud je sazba hodina, budou všechna data shromažďována v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou všechna data shromažďována v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupného sledování je, že uživatelské rozhraní monitorování modelů dokáže velmi rychle vybrat časový rozsah dat. |
"Den" Hodina 'Minuta' 'Month' 'Year' |
DataCollectorCollections
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | Kolekce |
Kolekce
Název | Description | Hodnota |
---|---|---|
clientId | ID klienta MSI použité ke shromažďování protokolování do úložiště objektů blob. Pokud má hodnotu null, back-end vybere pro ověření identitu registrovaného koncového bodu. | řetězec |
dataCollectionMode | Povolte nebo zakažte shromažďování dat. | Zakázáno 'Povoleno' |
id data | ID prostředku ARM datového assetu. Na straně klienta se zajistí, že datový prostředek ukazuje na úložiště objektů blob a back-end bude shromažďovat data do úložiště objektů blob. | řetězec |
vzorkovací rychlost | Vzorkovací frekvence pro kolekci. Vzorkovací frekvence 1.0 znamená, že ve výchozím nastavení shromažďujeme 100 % dat. | int |
Protokolování požadavků
Název | Description | Hodnota |
---|---|---|
captureHeaders | Pro protokolování datové části shromažďujeme ve výchozím nastavení jenom datovou část. Pokud zákazníci chtějí také shromažďovat zadané hlavičky, mohou je nastavit v captureHeaders tak, aby back-end shromažďoval tyto hlavičky spolu s datovou částí. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
ProbeSettings
Název | Description | Hodnota |
---|---|---|
failureThreshold | Počet selhání, která se mají povolit před vrácením stavu, který není v pořádku. | int |
Initialdelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
period | Délka doby mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | int |
timeout | Časový limit sondy ve formátu ISO 8601 | řetězec |
EndpointDeploymentPropertiesBaseVlastnosti
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
OnlineRequestSettings
Název | Description | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Maximální povolený počet souběžných požadavků na jeden uzel na nasazení. Výchozí hodnota je 1. | int |
maxQueueWait | Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500ms. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601 Výchozí hodnota je 5000ms. |
řetězec |
OnlineScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | Nastavení typu objektu | Default TargetUtilization (povinné) |
DefaultScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | Výchozí (povinné) |
TargetUtilizationScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | TargetUtilization (povinné) |
maxInstances | Maximální počet instancí, na které může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | int |
minInstances | Minimální počet instancí, které se mají vždy vyskytovat. | int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností na sekundy. | řetězec |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | int |
KubernetesOnlineDeployment
Název | Description | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetních prostředků koncového bodu. | Kubernetes (povinné) |
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
ContainerResourceRequirements
Název | Description | Hodnota |
---|---|---|
containerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o žádostech o prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Název | Description | Hodnota |
---|---|---|
Cpu | Počet požadavků nebo omezení počtu virtuálních procesorů pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet žádostí/omezení počtu karet Nvidia GPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek/limit velikosti paměti pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Nasazení ManagedOnlineDeployment
Název | Description | Hodnota |
---|---|---|
typcompute_koncového bodu | [Povinné] Typ výpočetních prostředků koncového bodu. | Spravované (povinné) |
Skladová jednotka (SKU)
Název | Description | Hodnota |
---|---|---|
capacity | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, mělo by být zahrnuto celé číslo kapacity. Pokud pro prostředek není možné škálovat na více nebo více instancí, může se to vynechat. | int |
family | Pokud má služba různé generace hardwaru pro stejnou skladovou položku, můžete to tady zaznamenat. | řetězec |
name | Název skladové položky. Příklad – P3. Obvykle se jedná o písmeno+číselný kód. | string (povinné) |
size | Velikost skladové položky. Pokud je pole pro název kombinací vrstvy a nějaké jiné hodnoty, jedná se o samostatný kód. | řetězec |
tier | Toto pole musí poskytovatel prostředků implementovat, pokud má služba více než jednu úroveň, ale nevyžaduje se u PUT. | 'Základní' 'Zdarma' Premium 'Standardní' |
Definice prostředku Terraform (poskytovatel AzAPI)
Typ prostředku pracovní prostory/ online koncové body/nasazení je možné nasadit s operacemi, které cílí na:
- Skupiny prostředků
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující Terraform.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objekty OnlineDeploymentProperties
Nastavením vlastnosti endpointComputeType zadejte typ objektu.
Pro Kubernetes použijte:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
V případě spravovaného použijte:
endpointComputeType = "Managed"
Objekty OnlineScaleSettings
Nastavte vlastnost scaleType a určete typ objektu.
Jako Výchozí použijte:
scaleType = "Default"
V části TargetUtilization (Využití cíle) použijte:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Hodnoty vlastností
pracovní prostory/online koncové body/nasazení
Název | Description | Hodnota |
---|---|---|
typ | Typ prostředku | Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview |
name | Název prostředku | string (povinné) |
location | Geografické umístění, kde se prostředek nachází | string (povinné) |
parent_id | ID prostředku, který je nadřazený pro tento prostředek. | ID prostředku typu: onlineEndpoints |
tags | Značky prostředků. | Slovník názvů a hodnot značek. |
Sku | Podrobnosti o SKU vyžadované pro kontrakt ARM pro automatické škálování | Sku |
Druhu | Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského prostředí pro prostředky stejného typu. | řetězec |
identity | Identita spravované služby (identity přiřazené systémem nebo uživatelem) | Identita spravované služby |
properties | [Povinné] Další atributy entity | OnlineDeploymentProperties (povinné) |
Identita spravované služby
Název | Description | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned) | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (povinné) |
identity_ids | Sada identit přiřazených uživatelem přidružených k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formátu /subscriptions/{subscriptionId}/resourceGroups/{název_skupiny_prostředků}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | Pole ID identit uživatelů |
UserAssignedIdentity
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | UserAssignedIdentity |
UserAssignedIdentity
Tento objekt neobsahuje žádné vlastnosti, které by se nastavily během nasazování. Všechny vlastnosti jsou Jen pro čtení.
OnlineDeploymentProperties
Název | Description | Hodnota |
---|---|---|
appInsightsEnabled | Pokud ano, povolí protokolování Application Insights. | bool |
codeConfiguration | Konfigurace kódu pro nasazení koncového bodu | Konfigurace kódu |
dataCollector | V konfiguraci mdc zakážeme mdc, když má hodnotu null. | DataCollector |
description | Popis nasazení koncového bodu | řetězec |
egressPublicNetworkAccess | Pokud je povoleno, povolte přístup k veřejné síti výchozího přenosu dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | "Zakázáno" "Povoleno" |
environmentId | ID prostředku ARM specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ výpočetní instance. | řetězec |
živostProbe | Sonda živosti pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta identifikátoru URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu do vlastního kontejneru | řetězec |
properties | Slovník vlastností. Vlastnosti je možné přidat, ale ne odebrat ani změnit. | EndpointDeploymentPropertiesBaseVlastnosti |
připravenostProbe | Sonda připravenosti ověří, jestli je kontejner připravený pro obsluhu provozu. Vlastnosti a výchozí hodnoty jsou stejné jako u sondy živosti. | ProbeSettings |
requestSettings | Nastavení požadavku pro nasazení | OnlineRequestSettings |
scaleSettings | Nastavení škálování pro nasazení Pokud je hodnota null nebo není zadá, Výchozí hodnota je TargetUtilizationScaleSettings pro KubernetesOnlineDeployment. a na DefaultScaleSettings pro ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Nastavení typu objektu | Kubernetes Spravované (povinné) |
Konfigurace kódu
Název | Description | Hodnota |
---|---|---|
id kódu | ID prostředku ARM pro prostředek kódu. | řetězec |
scoringScript | [Povinné] Skript, který se má spustit při spuštění. např. "score.py" | string (povinné) Omezení: Minimální délka = 1 Pattern = [a-zA-Z0-9_] |
DataCollector
Název | Description | Hodnota |
---|---|---|
Sbírky | [Povinné] Konfigurace kolekce. Každá kolekce má vlastní konfiguraci pro shromažďování dat modelu a název kolekce může být libovolný řetězec. Kolektor dat modelu se dá použít buď pro protokolování datové části, nebo pro vlastní protokolování, nebo pro obojí. Požadavky a odpovědi na kolekci jsou vyhrazené pro protokolování datové části, jiné pro vlastní protokolování. |
DataCollectorCollections (povinné) |
requestLogging | Konfigurace protokolování požadavků pro mdc zahrnuje upřesňující nastavení protokolování pro všechny kolekce. Zpráva není povinná. | Protokolování požadavků |
rollingRate | Když se data modelu shromažďují do úložiště objektů blob, musíme je vrátit do jiné cesty, abychom se vyhnuli protokolování všech dat v jednom souboru objektu blob. Pokud je sazba hodina, budou všechna data shromažďována v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou všechna data shromažďována v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupného sledování je, že uživatelské rozhraní monitorování modelů dokáže velmi rychle vybrat časový rozsah dat. |
"Den" "Hodina" "Minuta" "Month" "Year" |
DataCollectorCollections
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | Kolekce |
Kolekce
Název | Description | Hodnota |
---|---|---|
clientId | ID klienta MSI použité ke shromažďování protokolování do úložiště objektů blob. Pokud má hodnotu null, back-end vybere pro ověření identitu registrovaného koncového bodu. | řetězec |
dataCollectionMode | Povolte nebo zakažte shromažďování dat. | "Zakázáno" "Povoleno" |
id data | ID prostředku ARM datového assetu. Na straně klienta se zajistí, že datový prostředek ukazuje na úložiště objektů blob a back-end bude shromažďovat data do úložiště objektů blob. | řetězec |
vzorkovací rychlost | Vzorkovací frekvence pro kolekci. Vzorkovací frekvence 1.0 znamená, že ve výchozím nastavení shromažďujeme 100 % dat. | int |
Protokolování požadavků
Název | Description | Hodnota |
---|---|---|
captureHeaders | Pro protokolování datové části shromažďujeme ve výchozím nastavení jenom datovou část. Pokud zákazníci chtějí také shromažďovat zadané hlavičky, mohou je nastavit v captureHeaders tak, aby back-end shromažďoval tyto hlavičky spolu s datovou částí. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
ProbeSettings
Název | Description | Hodnota |
---|---|---|
failureThreshold | Počet selhání, která se mají povolit před vrácením stavu, který není v pořádku. | int |
Initialdelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
period | Délka doby mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | int |
timeout | Časový limit sondy ve formátu ISO 8601 | řetězec |
EndpointDeploymentPropertiesBaseVlastnosti
Název | Description | Hodnota |
---|---|---|
{přizpůsobená vlastnost} | řetězec | |
{přizpůsobená vlastnost} | řetězec |
OnlineRequestSettings
Název | Description | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Maximální povolený počet souběžných požadavků na jeden uzel na nasazení. Výchozí hodnota je 1. | int |
maxQueueWait | Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500ms. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601 Výchozí hodnota je 5000ms. |
řetězec |
OnlineScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | Nastavení typu objektu | Default TargetUtilization (povinné) |
DefaultScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | "Výchozí" (povinné) |
TargetUtilizationScaleSettings
Název | Description | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | "TargetUtilization" (povinné) |
maxInstances | Maximální počet instancí, na které může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | int |
minInstances | Minimální počet instancí, které se mají vždy vyskytovat. | int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností na sekundy. | řetězec |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | int |
KubernetesOnlineDeployment
Název | Description | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetních prostředků koncového bodu. | Kubernetes (povinné) |
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
ContainerResourceRequirements
Název | Description | Hodnota |
---|---|---|
containerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o žádostech o prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Název | Description | Hodnota |
---|---|---|
Cpu | Počet požadavků nebo omezení počtu virtuálních procesorů pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet žádostí/omezení počtu karet Nvidia GPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek/limit velikosti paměti pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
ManagedOnlineDeployment
Název | Description | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetních prostředků koncového bodu. | "Spravované" (povinné) |
Skladová jednotka (SKU)
Název | Description | Hodnota |
---|---|---|
capacity | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, mělo by být zahrnuto celé číslo kapacity. Pokud u prostředku není možné provést horizontální navýšení nebo snížení kapacity, může být vynecháno. | int |
family | Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete to tady zaznamenat. | řetězec |
name | Název skladové položky. Příklad – P3. Obvykle se jedná o písmeno+číselný kód. | string (povinné) |
size | Velikost skladové položky Pokud je pole název kombinací vrstvy a nějaké jiné hodnoty, bude to samostatný kód. | řetězec |
tier | Toto pole musí poskytovatel prostředků implementovat, pokud má služba více než jednu úroveň, ale není vyžadováno u PUT. | "Základní" "Zdarma" "Premium" "Standardní" |
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro