Panoramica della distribuzione per Modelli Foundry di Microsoft (versione classica)

Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry. Altre informazioni sul nuovo portale.

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Il catalogo dei modelli in Microsoft Foundry è l'hub per individuare e usare un'ampia gamma di modelli Foundry per la creazione di applicazioni di intelligenza artificiale generative. È necessario distribuire i modelli per renderli disponibili per ricevere richieste di inferenza. Foundry offre una suite completa di opzioni di distribuzione per i modelli Foundry, a seconda delle esigenze e dei requisiti del modello.

Opzioni di distribuzione

Foundry offre diverse opzioni di distribuzione a seconda del tipo di modelli e delle risorse di cui è necessario eseguire il provisioning. Sono disponibili le opzioni di distribuzione seguenti:

  • Distribuzione standard nelle risorse Foundry
  • Implementazione negli endpoint API serverless
  • Distribuzione su risorse di calcolo gestite

Il portale foundry potrebbe scegliere automaticamente un'opzione di distribuzione in base all'ambiente e alla configurazione. Usare le risorse Foundry per la distribuzione quando possibile. I modelli che supportano più opzioni di distribuzione utilizzano per impostazione predefinita le risorse Foundry per la distribuzione. Per accedere ad altre opzioni di distribuzione, usare interfaccia della riga di comando di Azure o Azure Machine Learning SDK per la distribuzione.

Distribuzione standard nelle risorse Foundry

Le risorse foundry sono l'opzione di distribuzione preferita in Foundry. Offre la gamma più ampia di funzionalità, tra cui elaborazione regionale, zona dati o globale, e offre opzioni di velocità effettiva standard e con throughput provisionato. I modelli di punta in Foundry Models supportano questa opzione di distribuzione.

Questa opzione di distribuzione è disponibile in:

  • Risorse della fonderia
  • risorse di Azure OpenAI1
  • Azure AI hub, quando è connesso a una risorsa Foundry

1Se si utilizzano le risorse Azure OpenAI, il catalogo dei modelli mostra solo Azure OpenAI nei modelli di Foundry per la distribuzione. È possibile ottenere l'elenco completo dei modelli Foundry eseguendo l'aggiornamento a una risorsa Foundry.

Per iniziare a usare la distribuzione standard nelle risorse Foundry, vedere Procedura: Distribuire modelli nei modelli Foundry.

Un endpoint dell'API serverless

Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare endpoint dedicati per ospitare il modello, accessibile tramite un'API. I modelli foundry supportano gli endpoint API serverless con fatturazione con pagamento in base al consumo ed è possibile creare solo distribuzioni a livello di area per gli endpoint API serverless.

Per iniziare a usare la distribuzione in un endpoint API serverless, vedere Distribuire i modelli come distribuzioni di API serverless.

Calcolo gestito

Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare un endpoint dedicato per ospitare il modello in un ambiente di calcolo dedicato. È necessario disporre di una quota di calcolo nella tua sottoscrizione per ospitare il modello, e la fatturazione avviene in base al tempo di attività computazionale.

La distribuzione di calcolo gestita è necessaria per le raccolte di modelli che includono:

  • Hugging Face
  • Microservizi di inferenza NVIDIA
  • Modelli di settore (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
  • Databricks
  • Modelli personalizzati

Per iniziare, vedere Come distribuire e dedurre una distribuzione di calcolo gestita e Distribuire i modelli Foundry in un ambiente di calcolo gestito con fatturazione con pagamento in base al consumo.

Funzionalità per le opzioni di distribuzione

Usare le distribuzioni Standard nelle risorse Foundry quando possibile. Questa opzione di distribuzione offre la maggior parte delle funzionalità tra le opzioni di distribuzione disponibili. Nella tabella seguente sono elencati i dettagli sulle funzionalità specifiche per ogni opzione di distribuzione:

Capacità Distribuzione standard nelle risorse Foundry Punto finale API senza server Calcolo gestito
Quali modelli possono essere distribuiti? I Foundry Models venduti direttamente da Azure
Modelli di fonderia provenienti da partner e comunità
Modelli di fonderia con fatturazione a consumo Aprire e personalizzare i modelli
Risorsa di distribuzione Risorsa Fonderia Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale) Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale)
Richiede hub di intelligenza artificiale No
Opzioni di elaborazione dati Regionale
Zona dati
Globale
Regionale Regionale
Rete privata
Filtro del contenuto No
Filtro del contenuto personalizzato No No
Autenticazione senza chiave No No
Basi di fatturazione Utilizzo dei token e unità di throughput provisionato Utilizzo dei token2 Ore core di calcolo3

2 La fatturazione di un'infrastruttura endpoint minima avviene al minuto. Non viene addebitato alcun costo per l'infrastruttura che ospita il modello nella distribuzione serverless. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.

3 La fatturazione è al minuto, a seconda del livello prodotto e del numero di istanze usate nella distribuzione dal momento della creazione. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.