Panoramica della distribuzione per Modelli Foundry di Microsoft (versione classica)

Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry. Altre informazioni sul nuovo portale.

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Il catalogo dei modelli in Microsoft Foundry è l'hub per individuare e usare un'ampia gamma di modelli Foundry per la creazione di applicazioni di intelligenza artificiale generative. È necessario distribuire i modelli per renderli disponibili per ricevere richieste di inferenza. Foundry offre una suite completa di opzioni di distribuzione per i modelli Foundry, a seconda delle esigenze e dei requisiti del modello.

Opzioni di distribuzione

Foundry offre diverse opzioni di distribuzione a seconda del tipo di modelli e delle risorse di cui è necessario eseguire il provisioning. Sono disponibili le opzioni di distribuzione seguenti:

Distribuzione standard nelle risorse Foundry
Implementazione negli endpoint API serverless
Distribuzione su risorse di calcolo gestite

Il portale foundry potrebbe scegliere automaticamente un'opzione di distribuzione in base all'ambiente e alla configurazione. Usare le risorse Foundry per la distribuzione quando possibile. I modelli che supportano più opzioni di distribuzione utilizzano per impostazione predefinita le risorse Foundry per la distribuzione. Per accedere ad altre opzioni di distribuzione, usare interfaccia della riga di comando di Azure o Azure Machine Learning SDK per la distribuzione.

Distribuzione standard nelle risorse Foundry

Le risorse foundry sono l'opzione di distribuzione preferita in Foundry. Offre la gamma più ampia di funzionalità, tra cui elaborazione regionale, zona dati o globale, e offre opzioni di velocità effettiva standard e con throughput provisionato. I modelli di punta in Foundry Models supportano questa opzione di distribuzione.

Questa opzione di distribuzione è disponibile in:

Risorse della fonderia
risorse di Azure OpenAI¹
Azure AI hub, quando è connesso a una risorsa Foundry

¹Se si utilizzano le risorse Azure OpenAI, il catalogo dei modelli mostra solo Azure OpenAI nei modelli di Foundry per la distribuzione. È possibile ottenere l'elenco completo dei modelli Foundry eseguendo l'aggiornamento a una risorsa Foundry.

Per iniziare a usare la distribuzione standard nelle risorse Foundry, vedere Procedura: Distribuire modelli nei modelli Foundry.

Un endpoint dell'API serverless

Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare endpoint dedicati per ospitare il modello, accessibile tramite un'API. I modelli foundry supportano gli endpoint API serverless con fatturazione con pagamento in base al consumo ed è possibile creare solo distribuzioni a livello di area per gli endpoint API serverless.

Per iniziare a usare la distribuzione in un endpoint API serverless, vedere Distribuire i modelli come distribuzioni di API serverless.

Calcolo gestito

Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare un endpoint dedicato per ospitare il modello in un ambiente di calcolo dedicato. È necessario disporre di una quota di calcolo nella tua sottoscrizione per ospitare il modello, e la fatturazione avviene in base al tempo di attività computazionale.

La distribuzione di calcolo gestita è necessaria per le raccolte di modelli che includono:

Hugging Face
Microservizi di inferenza NVIDIA
Modelli di settore (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
Databricks
Modelli personalizzati

Per iniziare, vedere Come distribuire e dedurre una distribuzione di calcolo gestita e Distribuire i modelli Foundry in un ambiente di calcolo gestito con fatturazione con pagamento in base al consumo.

Funzionalità per le opzioni di distribuzione

Usare le distribuzioni Standard nelle risorse Foundry quando possibile. Questa opzione di distribuzione offre la maggior parte delle funzionalità tra le opzioni di distribuzione disponibili. Nella tabella seguente sono elencati i dettagli sulle funzionalità specifiche per ogni opzione di distribuzione:

Capacità	Distribuzione standard nelle risorse Foundry	Punto finale API senza server	Calcolo gestito
Quali modelli possono essere distribuiti?	I Foundry Models venduti direttamente da Azure Modelli di fonderia provenienti da partner e comunità	Modelli di fonderia con fatturazione a consumo	Aprire e personalizzare i modelli
Risorsa di distribuzione	Risorsa Fonderia	Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale)	Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale)
Richiede hub di intelligenza artificiale	No	Sì	Sì
Opzioni di elaborazione dati	Regionale Zona dati Globale	Regionale	Regionale
Rete privata	Sì	Sì	Sì
Filtro del contenuto	Sì	Sì	No
Filtro del contenuto personalizzato	Sì	No	No
Autenticazione senza chiave	Sì	No	No
Basi di fatturazione	Utilizzo dei token e unità di throughput provisionato	Utilizzo dei token²	Ore core di calcolo³

² La fatturazione di un'infrastruttura endpoint minima avviene al minuto. Non viene addebitato alcun costo per l'infrastruttura che ospita il modello nella distribuzione serverless. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.

³ La fatturazione è al minuto, a seconda del livello prodotto e del numero di istanze usate nella distribuzione dal momento della creazione. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-05-01