Microsoft.MachineLearningServices-werkruimten/onlineEndpoints/deployments 2023-08-01-preview
Bicep-resourcedefinitie
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-08-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Gebruik voor Beheerd:
endpointComputeType: 'Managed'
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
scaleType: 'Default'
Gebruik voor TargetUtilization:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in Bicep. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
Bovenliggende | In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie Onderliggende resource buiten bovenliggende resource voor meer informatie. |
Symbolische naam voor resource van het type: onlineEndpoints |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentEigenschappen (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | UserAssignedId-entiteiten |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
dataCollector | Bij de mdc-configuratie schakelen we mdc uit wanneer deze null is. | DataCollector |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. | 'Uitgeschakeld' Ingeschakeld |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
DataCollector
Naam | Description | Waarde |
---|---|---|
Collecties | [Vereist] De configuratie van de verzameling. Elke verzameling heeft een eigen configuratie voor het verzamelen van modelgegevens en de naam van de verzameling kan een willekeurige tekenreeks zijn. Modelgegevensverzamelaar kan worden gebruikt voor logboekregistratie van nettoladingen of aangepaste logboekregistratie of beide. Verzamelingsaanvragen en -antwoorden zijn gereserveerd voor logboekregistratie van nettoladingen, andere zijn voor aangepaste logboekregistratie. |
DataCollectorCollections (vereist) |
requestLogging | De configuratie van aanvraaglogboekregistratie voor mdc bevat geavanceerde instellingen voor logboekregistratie voor alle verzamelingen. Dit is niet verplicht. | RequestLogging |
rollingRate | Wanneer modelgegevens worden verzameld naar blobopslag, moeten we de gegevens naar een ander pad rollen om te voorkomen dat ze allemaal in één blobbestand worden geregistreerd. Als de doorlopende snelheid uur is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/uu/. Als het dag is, worden alle gegevens verzameld in blobpad /jjjj/MM/dd/. Het andere voordeel van het doorlopende pad is dat de gebruikersinterface voor modelbewaking zeer snel een tijdsbereik met gegevens kan selecteren. |
'Dag' 'Uur' 'Minuut' 'Maand' 'Jaar' |
DataCollectorCollections
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | Verzameling |
Verzameling
Naam | Description | Waarde |
---|---|---|
clientId | De msi-client-id die wordt gebruikt voor het verzamelen van logboekregistratie naar blob-opslag. Als deze null is, kiest de back-end een geregistreerde eindpuntidentiteit voor verificatie. | tekenreeks |
dataCollectionMode | Gegevensverzameling in- of uitschakelen. | 'Uitgeschakeld' Ingeschakeld |
dataId | De resource-id van de arm van de gegevensasset. De clientzijde zorgt ervoor dat de gegevensasset naar de blob-opslag wijst en dat de back-end gegevens verzamelt naar de blob-opslag. | tekenreeks |
samplingRate | De steekproeffrequentie voor verzameling. Steekproeffrequentie 1,0 betekent dat we standaard 100% van de gegevens verzamelen. | int |
RequestLogging
Naam | Description | Waarde |
---|---|---|
captureHeaders | Voor logboekregistratie van nettoladingen verzamelen we standaard alleen nettoladingen. Als klanten ook de opgegeven headers willen verzamelen, kunnen ze deze instellen in captureHeaders, zodat de back-end deze headers samen met de nettolading verzamelt. | tekenreeks[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale hoeveelheid tijd dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De time-out voor scores in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard TargetUtilization (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'TargetUtilization' (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (CPU en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over containerresourcelimiet: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal Nvidia GPU-kaarten aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. | int |
gezin | Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basic' 'Gratis' Premium 'Standaard' |
Resourcedefinitie van ARM-sjabloon
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-08-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Gebruik voor Beheerd:
"endpointComputeType": "Managed"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
"scaleType": "Default"
Gebruik voor TargetUtilization:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | De resource-API-versie | '2023-08-01-preview' |
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in JSON ARM-sjablonen. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentEigenschappen (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | UserAssignedId-entiteiten |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
dataCollector | Bij de mdc-configuratie schakelen we mdc uit wanneer deze null is. | DataCollector |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. | 'Uitgeschakeld' Ingeschakeld |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
DataCollector
Naam | Description | Waarde |
---|---|---|
Collecties | [Vereist] De configuratie van de verzameling. Elke verzameling heeft een eigen configuratie voor het verzamelen van modelgegevens en de naam van de verzameling kan een willekeurige tekenreeks zijn. Modelgegevensverzamelaar kan worden gebruikt voor logboekregistratie van nettoladingen of aangepaste logboekregistratie of beide. Verzamelingsaanvragen en -antwoorden zijn gereserveerd voor logboekregistratie van nettoladingen, andere zijn voor aangepaste logboekregistratie. |
DataCollectorCollections (vereist) |
requestLogging | De configuratie van aanvraaglogboekregistratie voor mdc bevat geavanceerde instellingen voor logboekregistratie voor alle verzamelingen. Dit is niet verplicht. | RequestLogging |
rollingRate | Wanneer modelgegevens worden verzameld naar blobopslag, moeten we de gegevens naar een ander pad rollen om te voorkomen dat ze allemaal in één blobbestand worden geregistreerd. Als de doorlopende snelheid uur is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/uu/. Als het dag is, worden alle gegevens verzameld in blobpad /jjjj/MM/dd/. Het andere voordeel van het doorlopende pad is dat de gebruikersinterface voor modelbewaking zeer snel een tijdsbereik met gegevens kan selecteren. |
'Dag' 'Uur' 'Minuut' 'Maand' 'Jaar' |
DataCollectorCollections
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | Verzameling |
Verzameling
Naam | Description | Waarde |
---|---|---|
clientId | De msi-client-id die wordt gebruikt voor het verzamelen van logboekregistratie naar blob-opslag. Als deze null is, kiest de back-end een geregistreerde eindpuntidentiteit voor verificatie. | tekenreeks |
dataCollectionMode | Gegevensverzameling in- of uitschakelen. | 'Uitgeschakeld' Ingeschakeld |
dataId | De resource-id van de arm van de gegevensasset. De clientzijde zorgt ervoor dat de gegevensasset naar de blobopslag verwijst en dat de back-end gegevens verzamelt naar de blob-opslag. | tekenreeks |
samplingRate | De steekproeffrequentie voor het verzamelen. Steekproeffrequentie 1,0 betekent dat we standaard 100% van de gegevens verzamelen. | int |
RequestLogging
Naam | Description | Waarde |
---|---|---|
captureHeaders | Voor logboekregistratie van nettoladingen verzamelen we standaard alleen nettolading. Als klanten ook de opgegeven headers willen verzamelen, kunnen ze deze instellen in captureHeaders, zodat de back-end deze headers samen met de nettolading verzamelt. | tekenreeks[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale tijdsduur dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De scoretime-out in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard Doelgebruik (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Doelgebruik' (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over limiet voor containerresources: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal aanvraag/limiet voor Nvidia GPU-kaarten voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, wordt dit mogelijk weggelaten. | int |
gezin | Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan dat hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basic' 'Gratis' 'Premium' 'Standaard' |
Terraform-resourcedefinitie (AzAPI-provider)
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-08-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Gebruik voor Beheerd:
endpointComputeType = "Managed"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
scaleType = "Default"
Gebruik voor TargetUtilization:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-08-01-preview" |
naam | De resourcenaam | tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
parent_id | De id van de resource die het bovenliggende item voor deze resource is. | Id voor resource van het type: onlineEndpoints |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentEigenschappen (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). | "SystemAssigned" "SystemAssigned,UserAssigned" 'UserAssigned' (vereist) |
identity_ids | De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | Matrix met gebruikersidentiteits-id's. |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
dataCollector | Bij de mdc-configuratie schakelen we mdc uit wanneer deze null is. | DataCollector |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. | "Uitgeschakeld" "Ingeschakeld" |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
DataCollector
Naam | Description | Waarde |
---|---|---|
Collecties | [Vereist] De configuratie van de verzameling. Elke verzameling heeft een eigen configuratie voor het verzamelen van modelgegevens en de naam van de verzameling kan een willekeurige tekenreeks zijn. Modelgegevensverzamelaar kan worden gebruikt voor logboekregistratie van nettoladingen of aangepaste logboekregistratie of beide. Verzamelingsaanvragen en -antwoorden zijn gereserveerd voor logboekregistratie van nettoladingen, andere zijn voor aangepaste logboekregistratie. |
DataCollectorCollections (vereist) |
requestLogging | De configuratie van aanvraaglogboekregistratie voor mdc bevat geavanceerde instellingen voor logboekregistratie voor alle verzamelingen. Dit is niet verplicht. | RequestLogging |
rollingRate | Wanneer modelgegevens worden verzameld naar blobopslag, moeten we de gegevens naar een ander pad rollen om te voorkomen dat ze allemaal in één blobbestand worden geregistreerd. Als de doorlopende snelheid uur is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/HH/. Als het dag is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/. Het andere voordeel van het doorlopende pad is dat de gebruikersinterface voor modelbewaking zeer snel een tijdsbereik met gegevens kan selecteren. |
"Dag" "Uur" "Minuut" "Maand" "Jaar" |
DataCollectorCollections
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | Verzameling |
Verzameling
Naam | Description | Waarde |
---|---|---|
clientId | De msi-client-id die wordt gebruikt voor het verzamelen van logboekregistratie naar blob-opslag. Als deze null is, kiest de back-end een geregistreerde eindpuntidentiteit voor verificatie. | tekenreeks |
dataCollectionMode | Gegevensverzameling in- of uitschakelen. | "Uitgeschakeld" "Ingeschakeld" |
dataId | De resource-id van de arm van de gegevensasset. De clientzijde zorgt ervoor dat de gegevensasset naar de blob-opslag wijst en dat de back-end gegevens verzamelt naar de blob-opslag. | tekenreeks |
samplingRate | De steekproeffrequentie voor verzameling. Steekproeffrequentie 1,0 betekent dat we standaard 100% van de gegevens verzamelen. | int |
RequestLogging
Naam | Description | Waarde |
---|---|---|
captureHeaders | Voor logboekregistratie van nettoladingen verzamelen we standaard alleen nettoladingen. Als klanten ook de opgegeven headers willen verzamelen, kunnen ze deze instellen in captureHeaders, zodat de back-end deze headers samen met de nettolading verzamelt. | tekenreeks[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale hoeveelheid tijd dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De time-out voor scores in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard TargetUtilization (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'TargetUtilization' (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (CPU en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over containerresourcelimiet: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal Nvidia GPU-kaarten aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. | int |
gezin | Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | "Basis" "Gratis" "Premium" "Standaard" |
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor