Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/onlineEndpoints/deployments

Definizione di risorsa Bicep

Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:

  • gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il bicep seguente al modello.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Per gestito, usare:

  endpointComputeType: 'Managed'

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per predefinito, usare:

  scaleType: 'Default'

Per TargetUtilization, usare:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valori delle proprietà

workspaces/onlineEndpoints/deployments

Nome Descrizione Valore
nome Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
Tag Tag di risorsa. Dizionario di nomi e valori di tag. Vedere tag nei modelli
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
genitore In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere risorsa figlio all'esterno della risorsa padre.
Nome simbolico per la risorsa di tipo: onlineEndpoints
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. Bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
dataCollector La configurazione mdc viene disabilitata quando è Null. DataCollector
descrizione Descrizione della distribuzione dell'endpoint. corda
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. 'Disabilitato'
'Enabled'
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. corda
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. corda
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
modello Percorso URI del modello. corda
modelMountPath Percorso di montaggio del modello in un contenitore personalizzato. corda
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Ridimensionare le impostazioni per la distribuzione.
Se è null o non è specificato,
per impostazione predefinita è TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto kubernetes
gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Nome Descrizione Valore
collezioni [Obbligatorio] Configurazione della raccolta. Ogni raccolta ha una configurazione specifica per raccogliere i dati del modello e il nome della raccolta può essere una stringa arbitraria.
L'agente di raccolta dati del modello può essere usato per la registrazione del payload o per la registrazione personalizzata o per entrambi. La richiesta e la risposta di raccolta sono riservate per la registrazione del payload, mentre altre sono destinate alla registrazione personalizzata.
DataCollectorCollections (obbligatorio)
requestLogging La configurazione di registrazione delle richieste per mdc include impostazioni di registrazione avanzate per tutte le raccolte. È facoltativo. RequestLogging
RollingRate Quando i dati del modello vengono raccolti nell'archivio BLOB, è necessario eseguire il rollback dei dati in un percorso diverso per evitare di registrarli tutti in un singolo file BLOB.
Se la frequenza di rotazione è oraria, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/HH/.
Se è il giorno, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/.
L'altro vantaggio del percorso in sequenza è che l'interfaccia utente di monitoraggio del modello è in grado di selezionare un intervallo di tempo di dati molto rapidamente.
'Day'
'Hour'
'Minute'
'Month'
'Year'

DataCollectorCollections

Nome Descrizione Valore
{proprietà personalizzata} raccolta

Collezione

Nome Descrizione Valore
clientId ID client msi usato per raccogliere la registrazione nell'archiviazione BLOB. Se è null, il back-end selezionerà un'identità dell'endpoint registrata per l'autenticazione. corda
dataCollectionMode Abilitare o disabilitare la raccolta dati. 'Disabilitato'
'Enabled'
dataId ID risorsa arm dell'asset di dati. Il lato client garantirà che l'asset di dati punti all'archiviazione BLOB e il back-end raccoglierà i dati nell'archivio BLOB. corda
campionamentoRate Frequenza di campionamento per la raccolta. La frequenza di campionamento 1,0 indica che vengono raccolti 100% di dati per impostazione predefinita. Int

RequestLogging

Nome Descrizione Valore
captureHeaders Per la registrazione del payload, il payload viene raccolto solo per impostazione predefinita. Se i clienti vogliono raccogliere anche le intestazioni specificate, possono impostarle in captureHeaders in modo che il back-end raccolga tali intestazioni insieme al payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
maxQueueWait (Deprecato per gli endpoint online gestiti) La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500 ms.
(Aumentare ora request_timeout_ms per tenere conto di eventuali ritardi di rete/coda)
corda
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto predefinita
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione 'Default' (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione 'TargetUtilization' (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. Int
minInstances Numero minimo di istanze da presentare sempre. Int
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. corda
targetUtilizationPercentage Usare la CPU di destinazione per il ridimensionamento automatico. Int

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Kubernetes' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite di risorse del contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
CPU Numero di richieste/limiti di vCPU per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memoria Richiesta/limite di dimensioni della memoria per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione di risorsa del modello di Resource Manager

Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:

  • gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2024-07-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Per gestito, usare:

  "endpointComputeType": "Managed"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per predefinito, usare:

  "scaleType": "Default"

Per TargetUtilization, usare:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valori delle proprietà

workspaces/onlineEndpoints/deployments

Nome Descrizione Valore
digitare Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Versione dell'API della risorsa '2024-07-01-preview'
nome Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in modelli DI Resource Manager JSON.
stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
Tag Tag di risorsa. Dizionario di nomi e valori di tag. Vedere tag nei modelli
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). 'Nessuno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (obbligatorio)
userAssignedIdentities Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. UserAssignedIdentities

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. Bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
dataCollector La configurazione mdc viene disabilitata quando è Null. DataCollector
descrizione Descrizione della distribuzione dell'endpoint. corda
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. 'Disabilitato'
'Enabled'
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. corda
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. corda
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
modello Percorso URI del modello. corda
modelMountPath Percorso di montaggio del modello in un contenitore personalizzato. corda
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Ridimensionare le impostazioni per la distribuzione.
Se è null o non è specificato,
per impostazione predefinita è TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto kubernetes
gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Nome Descrizione Valore
collezioni [Obbligatorio] Configurazione della raccolta. Ogni raccolta ha una configurazione specifica per raccogliere i dati del modello e il nome della raccolta può essere una stringa arbitraria.
L'agente di raccolta dati del modello può essere usato per la registrazione del payload o per la registrazione personalizzata o per entrambi. La richiesta e la risposta di raccolta sono riservate per la registrazione del payload, mentre altre sono destinate alla registrazione personalizzata.
DataCollectorCollections (obbligatorio)
requestLogging La configurazione di registrazione delle richieste per mdc include impostazioni di registrazione avanzate per tutte le raccolte. È facoltativo. RequestLogging
RollingRate Quando i dati del modello vengono raccolti nell'archivio BLOB, è necessario eseguire il rollback dei dati in un percorso diverso per evitare di registrarli tutti in un singolo file BLOB.
Se la frequenza di rotazione è oraria, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/HH/.
Se è il giorno, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/.
L'altro vantaggio del percorso in sequenza è che l'interfaccia utente di monitoraggio del modello è in grado di selezionare un intervallo di tempo di dati molto rapidamente.
'Day'
'Hour'
'Minute'
'Month'
'Year'

DataCollectorCollections

Nome Descrizione Valore
{proprietà personalizzata} raccolta

Collezione

Nome Descrizione Valore
clientId ID client msi usato per raccogliere la registrazione nell'archiviazione BLOB. Se è null, il back-end selezionerà un'identità dell'endpoint registrata per l'autenticazione. corda
dataCollectionMode Abilitare o disabilitare la raccolta dati. 'Disabilitato'
'Enabled'
dataId ID risorsa arm dell'asset di dati. Il lato client garantirà che l'asset di dati punti all'archiviazione BLOB e il back-end raccoglierà i dati nell'archivio BLOB. corda
campionamentoRate Frequenza di campionamento per la raccolta. La frequenza di campionamento 1,0 indica che vengono raccolti 100% di dati per impostazione predefinita. Int

RequestLogging

Nome Descrizione Valore
captureHeaders Per la registrazione del payload, il payload viene raccolto solo per impostazione predefinita. Se i clienti vogliono raccogliere anche le intestazioni specificate, possono impostarle in captureHeaders in modo che il back-end raccolga tali intestazioni insieme al payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
maxQueueWait (Deprecato per gli endpoint online gestiti) La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500 ms.
(Aumentare ora request_timeout_ms per tenere conto di eventuali ritardi di rete/coda)
corda
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto predefinita
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione 'Default' (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione 'TargetUtilization' (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. Int
minInstances Numero minimo di istanze da presentare sempre. Int
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. corda
targetUtilizationPercentage Usare la CPU di destinazione per il ridimensionamento automatico. Int

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Kubernetes' (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite di risorse del contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
CPU Numero di richieste/limiti di vCPU per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memoria Richiesta/limite di dimensioni della memoria per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. 'Managed' (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. 'Basic'
'Free'
'Premium'
'Standard'

Definizione di risorsa Terraform (provider AzAPI)

Il tipo di risorsa workspaces/onlineEndpoints/deployments può essere distribuito con operazioni destinate a:

  • gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, aggiungere il codice Terraform seguente al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Oggetti OnlineDeploymentProperties

Impostare la proprietà endpointComputeType per specificare il tipo di oggetto.

Per Kubernetes, usare:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Per gestito, usare:

  endpointComputeType = "Managed"

Oggetti OnlineScaleSettings

Impostare la proprietà scaleType per specificare il tipo di oggetto.

Per predefinito, usare:

  scaleType = "Default"

Per TargetUtilization, usare:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valori delle proprietà

workspaces/onlineEndpoints/deployments

Nome Descrizione Valore
digitare Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-07-01-preview"
nome Nome della risorsa stringa (obbligatorio)
ubicazione Posizione geografica in cui risiede la risorsa stringa (obbligatorio)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: onlineEndpoints
Tag Tag di risorsa. Dizionario di nomi e valori di tag.
Sku Dettagli sku necessari per il contratto ARM per la scalabilità automatica. sku
gentile Metadati usati dal portale, dagli strumenti e così via per eseguire il rendering di esperienze utente diverse per le risorse dello stesso tipo. corda
identità Identità del servizio gestita (identità assegnate dal sistema e/o assegnate dall'utente) ManagedServiceIdentity
proprietà [Obbligatorio] Attributi aggiuntivi dell'entità. OnlineDeploymentProperties (obbligatorio)

ManagedServiceIdentity

Nome Descrizione Valore
digitare Tipo di identità del servizio gestito (in cui sono consentiti sia i tipi SystemAssigned che UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obbligatorio)
identity_ids Set di identità assegnate dall'utente associate alla risorsa. Le chiavi del dizionario userAssignedIdentities saranno ID risorsa ARM nel formato : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. I valori del dizionario possono essere oggetti vuoti ({}) nelle richieste. Matrice di ID identità utente.

UserAssignedIdentities

Nome Descrizione Valore
{proprietà personalizzata} userAssignedIdentity

UserAssignedIdentity

Questo oggetto non contiene proprietà da impostare durante la distribuzione. Tutte le proprietà sono ReadOnly.

OnlineDeploymentProperties

Nome Descrizione Valore
appInsightsEnabled Se true, abilita la registrazione di Application Insights. Bool
codeConfiguration Configurazione del codice per la distribuzione dell'endpoint. CodeConfiguration
dataCollector La configurazione mdc viene disabilitata quando è Null. DataCollector
descrizione Descrizione della distribuzione dell'endpoint. corda
egressPublicNetworkAccess Se abilitato, consentire l'accesso alla rete pubblica in uscita. Se Disabilitato, verrà creato un traffico in uscita sicuro. Impostazione predefinita: abilitata. "Disabilitato"
"Abilitato"
environmentId ID risorsa ARM o AssetId della specifica dell'ambiente per la distribuzione dell'endpoint. corda
environmentVariables Configurazione delle variabili di ambiente per la distribuzione. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Tipo di istanza di calcolo. corda
livenessProbe Il probe di attività monitora regolarmente l'integrità del contenitore. ProbeSettings
modello Percorso URI del modello. corda
modelMountPath Percorso di montaggio del modello in un contenitore personalizzato. corda
proprietà Dizionario delle proprietà. Le proprietà possono essere aggiunte, ma non rimosse o modificate. EndpointDeploymentPropertiesBaseProperties
readinessProbe Il probe di idoneità convalida se il contenitore è pronto per gestire il traffico. Le proprietà e le impostazioni predefinite sono uguali a quella del probe di attività. ProbeSettings
requestSettings Richiedere le impostazioni per la distribuzione. OnlineRequestSettings
scaleSettings Ridimensionare le impostazioni per la distribuzione.
Se è null o non è specificato,
per impostazione predefinita è TargetUtilizationScaleSettings per KubernetesOnlineDeployment
e in DefaultScaleSettings per ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Impostare il tipo di oggetto kubernetes
gestito (obbligatorio)

CodeConfiguration

Nome Descrizione Valore
codeId ID risorsa ARM dell'asset di codice. corda
punteggioScript [Obbligatorio] Script da eseguire all'avvio. ad esempio. "score.py" stringa (obbligatorio)

Vincoli:
Lunghezza minima = 1
Pattern = [a-zA-Z0-9_]

DataCollector

Nome Descrizione Valore
collezioni [Obbligatorio] Configurazione della raccolta. Ogni raccolta ha una configurazione specifica per raccogliere i dati del modello e il nome della raccolta può essere una stringa arbitraria.
L'agente di raccolta dati del modello può essere usato per la registrazione del payload o per la registrazione personalizzata o per entrambi. La richiesta e la risposta di raccolta sono riservate per la registrazione del payload, mentre altre sono destinate alla registrazione personalizzata.
DataCollectorCollections (obbligatorio)
requestLogging La configurazione di registrazione delle richieste per mdc include impostazioni di registrazione avanzate per tutte le raccolte. È facoltativo. RequestLogging
RollingRate Quando i dati del modello vengono raccolti nell'archivio BLOB, è necessario eseguire il rollback dei dati in un percorso diverso per evitare di registrarli tutti in un singolo file BLOB.
Se la frequenza di rotazione è oraria, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/HH/.
Se è il giorno, tutti i dati verranno raccolti nel percorso BLOB /aaaa/MM/gg/.
L'altro vantaggio del percorso in sequenza è che l'interfaccia utente di monitoraggio del modello è in grado di selezionare un intervallo di tempo di dati molto rapidamente.
"Giorno"
"Hour"
"Minute"
"Mese"
"Year"

DataCollectorCollections

Nome Descrizione Valore
{proprietà personalizzata} raccolta

Collezione

Nome Descrizione Valore
clientId ID client msi usato per raccogliere la registrazione nell'archiviazione BLOB. Se è null, il back-end selezionerà un'identità dell'endpoint registrata per l'autenticazione. corda
dataCollectionMode Abilitare o disabilitare la raccolta dati. "Disabilitato"
"Abilitato"
dataId ID risorsa arm dell'asset di dati. Il lato client garantirà che l'asset di dati punti all'archiviazione BLOB e il back-end raccoglierà i dati nell'archivio BLOB. corda
campionamentoRate Frequenza di campionamento per la raccolta. La frequenza di campionamento 1,0 indica che vengono raccolti 100% di dati per impostazione predefinita. Int

RequestLogging

Nome Descrizione Valore
captureHeaders Per la registrazione del payload, il payload viene raccolto solo per impostazione predefinita. Se i clienti vogliono raccogliere anche le intestazioni specificate, possono impostarle in captureHeaders in modo che il back-end raccolga tali intestazioni insieme al payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nome Descrizione Valore
{proprietà personalizzata} corda

ProbeSettings

Nome Descrizione Valore
failureThreshold Numero di errori da consentire prima di restituire uno stato non integro. Int
initialDelay Ritardo prima del primo probe in formato ISO 8601. corda
periodo Intervallo di tempo tra probe in formato ISO 8601. corda
successThreshold Numero di probe riusciti prima di restituire uno stato integro. Int
Timeout Timeout del probe in formato ISO 8601. corda

EndpointDeploymentPropertiesBaseProperties

Nome Descrizione Valore
{proprietà personalizzata} corda

OnlineRequestSettings

Nome Descrizione Valore
maxConcurrentRequestsPerInstance Numero massimo di richieste simultanee consentite per nodo per distribuzione. Il valore predefinito è 1. Int
maxQueueWait (Deprecato per gli endpoint online gestiti) La quantità massima di tempo per cui una richiesta rimarrà nella coda in formato ISO 8601.
Il valore predefinito è 500 ms.
(Aumentare ora request_timeout_ms per tenere conto di eventuali ritardi di rete/coda)
corda
requestTimeout Timeout di assegnazione dei punteggi in formato ISO 8601.
Il valore predefinito è 5000 ms.
corda

OnlineScaleSettings

Nome Descrizione Valore
scaleType Impostare il tipo di oggetto predefinita
TargetUtilization (obbligatorio)

DefaultScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione "Default" (obbligatorio)

TargetUtilizationScaleSettings

Nome Descrizione Valore
scaleType [Obbligatorio] Tipo di algoritmo di ridimensionamento della distribuzione "TargetUtilization" (obbligatorio)
maxInstances Numero massimo di istanze a cui la distribuzione può essere ridimensionata. La quota verrà riservata per max_instances. Int
minInstances Numero minimo di istanze da presentare sempre. Int
pollingInterval Intervallo di polling in formato ISO 8691. Supporta solo la durata con precisione inferiore a secondi. corda
targetUtilizationPercentage Usare la CPU di destinazione per il ridimensionamento automatico. Int

KubernetesOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "Kubernetes" (obbligatorio)
containerResourceRequirements Requisiti delle risorse per il contenitore (CPU e memoria). ContainerResourceRequirements

ContainerResourceRequirements

Nome Descrizione Valore
containerResourceLimits Informazioni sul limite di risorse del contenitore: ContainerResourceSettings
containerResourceRequests Informazioni sulla richiesta di risorse contenitore: ContainerResourceSettings

ContainerResourceSettings

Nome Descrizione Valore
CPU Numero di richieste/limiti di vCPU per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
Gpu Numero di richieste/limiti di schede GPU Nvidia per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda
memoria Richiesta/limite di dimensioni della memoria per il contenitore. Altre informazioni:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
corda

ManagedOnlineDeployment

Nome Descrizione Valore
endpointComputeType [Obbligatorio] Tipo di calcolo dell'endpoint. "Gestito" (obbligatorio)

Sku

Nome Descrizione Valore
capacità Se lo SKU supporta l'aumento o l'aumento del numero di istanze, è necessario includere l'intero della capacità. Se non è possibile aumentare o ridurre il numero di istanze per la risorsa, potrebbe essere omesso. Int
famiglia Se il servizio ha generazioni diverse di hardware, per lo stesso SKU, è possibile acquisire qui. corda
nome Nome dello SKU. Ad esempio - P3. Si tratta in genere di un codice lettera+numero stringa (obbligatorio)
grandezza Dimensioni dello SKU. Quando il campo nome è la combinazione di livello e un altro valore, si tratta del codice autonomo. corda
livello Questo campo deve essere implementato dal provider di risorse se il servizio ha più di un livello, ma non è necessario in un PUT. "Basic"
"Gratuito"
"Premium"
"Standard"