Condividi tramite


Distribuire modelli come endpoint API serverless

Questo articolo illustra come distribuire un modello dal catalogo modelli come API serverless con fatturazione basata su token con pagamento in base al consumo.

Alcuni modelli nel catalogo modelli possono essere distribuiti come API serverless con la fatturazione di pagamenti in base al consumo. Questo tipo di distribuzione consente di usare i modelli come le API senza ospitarli nella sottoscrizione, mantenendo al contempo la sicurezza e la conformità aziendali necessarie alle organizzazioni. Questa opzione di distribuzione non richiede la quota dalla sottoscrizione.

Prerequisiti

  • Una sottoscrizione di Azure con un metodo di pagamento valido. Le sottoscrizioni di Azure gratuite o di valutazione non funzioneranno. Se non si dispone di una sottoscrizione di Azure, è possibile creare un account Azure gratuito per iniziare.

  • Un'area di lavoro di Azure Machine Learning.

  • I controlli degli accessi in base al ruolo di Azure vengono usati per concedere l'accesso alle operazioni in Azure Machine Learning. Per eseguire la procedura descritta in questo articolo, all'account utente deve essere assegnato il ruolo di sviluppatore di Azure per intelligenza artificiale nel gruppo di risorse. Per ulteriori informazioni sulle autorizzazioni, vedere Controllo degli accessi in base al ruolo in Azure Machine Learning.

  • Per usare Azure Machine Learning, è necessario installare il software seguente:

    È possibile usare qualsiasi Web browser compatibile per esplorare Azure Machine Learning.

Sottoscrivere l'area di lavoro all'offerta del modello

I modelli offerti tramite Azure Marketplace possono essere distribuiti in endpoint API serverless per utilizzarne le stime. Se si sta distribuendo il modello nell'area di lavoro per la prima volta, sarà necessario sottoscrivere l'area di lavoro all'offerta di modello specifica da Azure Marketplace. Ogni spazio di lavoro ha una propria sottoscrizione all'offerta del modello di Azure Marketplace, che consente di controllare e monitorare le spese.

Nota

I modelli offerti tramite Azure Marketplace sono disponibili per la distribuzione in endpoint API serverless in aree specifiche. Controllare la Disponibilità aree per i modelli in endpoint API serverless per verificare quali aree siano disponibili. Se quella desiderata non compare nell’elenco, è possibile eseguire la distribuzione in un'area di lavoro in un'area supportata e quindi utilizzare endpoint API serverless da un'area di lavoro diversa.

  1. Accedere ad Azure Machine Learning Studio

  2. Assicurarsi che l'account disponga delle autorizzazioni del ruolo Sviluppatore di Azure per intelligenza artificiale per il gruppo di risorse o che si disponga delle autorizzazioni necessarie per sottoscrivere a offerte di modello.

  3. Passa all'area di lavoro.

  4. Selezionare Catalogo modelli nella barra laterale sinistra e trovare la scheda modello del modello che si vuole distribuire. In questo articolo, si selezionerà un modello Meta-Llama-3-8B-Instruct.

    1. Se si sta distribuendo il modello usando l'interfaccia della riga di comando di Azure, Python SDK o ARM, copiare l'ID modello.

    Importante

    Nella copia dell'ID modello, non includere la versione. Gli endpoint API serverless distribuiscono sempre la versione più recente del modello disponibile. Ad esempio, per l'ID modello azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3, copiare azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Screenshot che mostra la pagina dettagli di un modello.

  5. Creare la sottoscrizione al marketplace del modello. Nel creare una sottoscrizione, si accettano i termini e le condizioni associati all'offerta del modello.

    1. Nella pagina Dettagli modello, selezionare Distribuisci e quindi API serverless per aprire la distribuzione guidata.

    2. Selezionare la casella di controllo per accettare i criteri di acquisto Microsoft.

      Screenshot che mostra come distribuire un modello con l'opzione API serverless.

    3. Se viene visualizzata la nota Si dispone già di una sottoscrizione di Azure Marketplace per questa area di lavoro, non è necessario creare la sottoscrizione perché ne è già disponibile una. È possibile proseguire a Distribuire il modello in un endpoint API serverless.

    4. Nella distribuzione guidata selezionare il collegamento a Condizioni di Azure Marketplace per altre informazioni sulle condizioni per l'utilizzo. È anche possibile selezionare la scheda Prezzi e termini per informazioni sui prezzi per il modello selezionato.

    5. Nella distribuzione guidata selezionare il collegamento a Condizioni di Azure Marketplace per altre informazioni sulle condizioni per l'utilizzo. È anche possibile selezionare la scheda Dettagli sull'offerta in Marketplace per informazioni sui prezzi per il modello selezionato.

    6. Selezionare Sottoscrivi e distribuisci.

  6. Dopo la registrazione dell’area di lavoro a una determinata offerta di Azure Marketplace, le distribuzioni successive della stessa offerta nello stesso progetto non richiedono una nuova sottoscrizione.

  7. È possibile visualizzare in qualsiasi momento le offerte del modello a cui l'area di lavoro è attualmente sottoscritta:

    1. Accedere al portale di Azure

    2. Passare al gruppo di risorse a cui appartiene l'area di lavoro.

    3. Nel filtro Tipo, selezionare SaaS.

    4. Verranno visualizzate tutte le offerte a cui si è attualmente sottoscritti.

    5. Selezionare una risorsa per visualizzarne i dettagli.

Distribuire il modello in un endpoint API serverless

Dopo aver creato una sottoscrizione a un modello, è possibile distribuire il modello associato a un endpoint API serverless. L'endpoint API serverless consente di utilizzare modelli come API senza ospitarli nella sottoscrizione, mantenendo al tempo stesso la sicurezza e la conformità aziendali necessarie alle organizzazioni. Questa opzione di distribuzione non richiede la quota dalla sottoscrizione.

In questo articolo viene creato un endpoint denominato meta-llama3-8b-qwerty.

  1. Creare l'endpoint serverless

    1. Nella procedura guidata precedente, selezionare Distribuisci (se l'area di lavoro è stata appena sottoscritta all'offerta di modello nella sezione precedente) oppure Continua la distribuzione (se la procedura guidata di distribuzione ha comunicato Si ha già una sottoscrizione di Azure Marketplace per questa area di lavoro).

      Screenshot che mostra un'area di lavoro già sottoscritta all'offerta.

    2. Assegnare un nome alla distribuzione. Questo nome diventa parte dell'URL dell'API di distribuzione. Questo URL deve essere univoco in ogni area di Azure.

      Screenshot che mostra come specificare il nome della distribuzione da creare.

    3. Seleziona Distribuisci. Attendere che la distribuzione sia pronta e che si venga reindirizzati alla pagina Distribuzioni.

  2. È possibile visualizzare gli endpoint distribuiti nell'area di lavoro in qualsiasi momento:

    1. Passa all'area di lavoro.

    2. Seleziona Endpoint.

    3. Selezionare la scheda Endpoint serverless per visualizzare gli endpoint API serverless.

  3. L'endpoint creato usa l'autenticazione con chiave per l'autorizzazione. Usare la procedura seguente per ottenere le chiavi associate a un determinato endpoint.

    1. Per tornare alla pagina della distribuzione, selezionare il nome dell'endpoint dall'elenco di endpoint serverless.
    2. Prendere nota dell'URI di destinazione e della Chiave dell’endpoint. Usarli per chiamare la distribuzione e generare stime.

    Nota

    Quando si usa il portale di Azure, gli endpoint API serverless non vengono visualizzati per impostazione predefinita nel gruppo di risorse. Usare l'opzione Mostra tipi nascosti per visualizzarli nel gruppo di risorse.

  4. A questo punto, l'endpoint è pronto per l’uso.

  5. Se si ha bisogno di utilizzare questa distribuzione da un'altra area di lavoro o si prevede di usare il flusso prompt per creare applicazioni intelligenti, è necessario creare una connessione alla distribuzione dell'API serverless. Per informazioni su come configurare un endpoint API serverless esistente in un nuovo progetto o hub, vedere Utilizzare endpoint API serverless distribuiti da un'altra area di lavoro o dal Prompt flow.

    Suggerimento

    Se si usa il prompt flow nella stessa area di lavoro in cui è stata distribuita la distribuzione, sarà comunque necessario creare la connessione.

Uso dell'endpoint API serverless

I modelli distribuiti in Azure Machine Learning e Studio AI della piattaforma Azure in endpoint API serverless supportano l'API di inferenza del modello di intelligenza artificiale di Azure, che presenta un set comune di funzionalità per i modelli di base e che può essere usata dagli sviluppatori per utilizzare stime da un set diversificato di modelli in modo uniforme e coerente.

Ulteriori informazioni sulle funzionalità di questa API e su come sfruttarla durante la compilazione di applicazioni.

Eliminare endpoint e sottoscrizioni

È possibile eliminare sottoscrizioni ed endpoint del modello. L'eliminazione di una sottoscrizione modello rende qualsiasi endpoint associato Non integro e inutilizzabile.

Per eliminare un endpoint API serverless:

  1. Passare ad Azure Machine Learning Studio.

  2. Selezionare Endpoint nella barra laterale sinistra.

  3. Selezionare la scheda Endpoint serverless per visualizzare gli endpoint API serverless.

  4. Aprire l'endpoint da eliminare.

  5. Selezionare Elimina.

Per eliminare la sottoscrizione modello associata:

  1. Accedere al portale di Azure

  2. Passare al gruppo di risorse a cui appartiene l'area di lavoro.

  3. Nel filtro Tipo, selezionare SaaS.

  4. Selezionare la sottoscrizione da eliminare.

  5. Selezionare Elimina.

Considerazioni su costi e quote per i modelli distribuiti come endpoint API serverless

I modelli distribuiti come endpoint API serverless vengono offerti tramite Azure Marketplace e integrati con Azure Machine Learning per l'uso. È possibile trovare i prezzi di Azure Marketplace durante la distribuzione o l'ottimizzazione dei modelli.

Ogni volta che un’area di lavoro sottoscrive a una determinata offerta di Azure Marketplace, viene creata una nuova risorsa per tenere traccia dei costi associati al consumo. La stessa risorsa viene usata per tenere traccia dei costi associati all'inferenza e all'ottimizzazione; tuttavia, sono disponibili più contatori per tenere traccia di ogni scenario in modo indipendente.

Per altre informazioni su come tenere traccia dei costi, vedere Monitorare i costi per i modelli offerti tramite Azure Marketplace.

Screenshot che mostra diverse risorse corrispondenti a diverse offerte di modelli e ai contatori associati.

La quota viene gestita per distribuzione. Ogni distribuzione ha un limite di frequenza di 200.000 token al minuto e 1.000 richieste API al minuto. Tuttavia, c’è attualmente un limite di una distribuzione per ogni modello per ogni area di lavoro. Contattare il supporto tecnico di Microsoft Azure se i limiti di frequenza correnti non sono sufficienti per gli scenari in uso.

Autorizzazioni necessarie per la sottoscrizione a offerte di modello

I controlli degli accessi in base al ruolo di Azure vengono usati per concedere l'accesso alle operazioni in Azure Machine Learning. Per eseguire la procedura descritta in questo articolo, è necessario che all'account utente sia assegnato il ruolo di Proprietario, Collaboratore o Sviluppatore di intelligenza artificiale di Azure per la sottoscrizione di Azure. In alternativa, all'account può essere assegnato un ruolo personalizzato con le autorizzazioni seguenti:

  • Nella sottoscrizione di Azure, per sottoscrivere l'area di lavoro all'offerta di Azure Marketplace, una volta per ogni area di lavoro, per offerta:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Nel gruppo di risorse, per creare e usare la risorsa SaaS:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • Nell'area di lavoro, per distribuire gli endpoint (il ruolo data scientist di Azure Machine Learning contiene già queste autorizzazioni):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Per altre informazioni sulle autorizzazioni, vedere Gestire l'accesso a un'area di lavoro di Azure Machine Learning.