Condividi tramite


Creare endpoint per i servizi Web di Machine Learning Studio distribuiti (versione classica)

SI APPLICA A: Si applica a.Machine Learning Studio (versione classica) Non si applica a.di Azure Machine Learning

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Dopo avere distribuito un servizio Web, viene creato un endpoint predefinito per tale servizio. L'endpoint predefinito può essere chiamato usando la chiave API. È possibile aggiungere altri endpoint con le rispettive chiavi dal portale dei servizi Web. Ogni endpoint nel servizio Web viene indirizzato, limitato e gestito in modo indipendente. Ogni endpoint corrisponde a un URL univoco con una chiave di autorizzazione che è possibile distribuire ai clienti.

Aggiungere endpoint a un servizio Web

È possibile aggiungere un endpoint a un servizio Web usando il portale dei servizi Web di Machine Learning. Dopo aver creato l'endpoint, è possibile utilizzarlo tramite le API sincrone, le API batch e i fogli di lavoro di Excel.

Nota

Se sono stati aggiunti altri endpoint al servizio Web, non è possibile eliminare l'endpoint predefinito.

  1. Nella colonna di spostamento a sinistra di Machine Learning Studio (versione classica) fare clic su Servizi Web.
  2. Nella parte inferiore del dashboard dei servizi Web, fare clic su Gestisci endpoint. Il portale dei servizi Web di Machine Learning apre la pagina degli endpoint per il servizio Web.
  3. Fai clic su Nuovo.
  4. Immettere un nome e una descrizione per il nuovo endpoint. I nomi degli endpoint devono contenere al massimo 24 caratteri alfanumerici (con lettere minuscole). Selezionare il livello di registrazione e indicare se i dati di esempio sono abilitati. Per altre informazioni sulla registrazione, vedere Abilitare la registrazione per i servizi Web di Machine Learning.

Ridimensionare un servizio Web aggiungendo altri endpoint

Per impostazione predefinita, ogni servizio Web pubblicato è configurato per supportare 20 richieste simultanee fino a 200 richieste simultanee. Machine Learning Studio (versione classica) ottimizza automaticamente l'impostazione per offrire prestazioni ottimali per il servizio Web e il valore del portale viene ignorato.

Se si prevede di chiamare l'API con un carico superiore a 200 chiamate simultanee, il numero massimo supportato, è consigliabile creare più endpoint nello stesso servizio Web. È quindi possibile distribuire casualmente il carico tra tutti gli endpoint.

Il ridimensionamento di un servizio Web è un'attività comune. Alcuni motivi per il ridimensionamento consistono nella necessità di supportare più di 200 richieste simultanee, aumentare la disponibilità tramite più endpoint o fornire endpoint separati per il servizio Web. È possibile aumentare la scalabilità aggiungendo altri endpoint per lo stesso servizio Web tramite il portale del servizio Web di Machine Learning.

Tenere presente che l'uso di un numero elevato di chiamate simultanee può essere dannoso se non si chiama l'API con una frequenza altrettanto elevata. Se si inserisce un carico relativamente basso in un'API configurata per un carico elevato, è possibile che si verifichino timeout sporadici e/o picchi della latenza.

Le API sincrone in genere vengono usate nelle situazioni in cui si desidera una bassa latenza. La latenza qui indica il tempo impiegato dall'API per completare una richiesta e non tiene in considerazione i ritardi di rete. Si supponga di avere un'API con una latenza di 50 ms. Per utilizzare appieno la capacità disponibile con il livello di limitazione Elevato e il numero massimo di chiamate simultanee pari a 20, è necessario chiamare l'API 20 * 1000 / 50 = 400 volte al secondo. Estendendo ulteriormente questa capacità, un numero massimo di 200 chiamate simultanee permetterà di chiamare l'API 4000 volte al secondo, supponendo una latenza di 50 ms.

Passaggi successivi

Come usare un servizio Web di Machine Learning.