Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry.
Altre informazioni sul nuovo portale.
Nota
I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.
Il catalogo dei modelli in Microsoft Foundry è l'hub per individuare e usare un'ampia gamma di modelli Foundry per la creazione di applicazioni di intelligenza artificiale generative. È necessario distribuire i modelli per renderli disponibili per ricevere richieste di inferenza. Foundry offre una suite completa di opzioni di distribuzione per i modelli Foundry, a seconda delle esigenze e dei requisiti del modello.
Opzioni di distribuzione
Foundry offre diverse opzioni di distribuzione a seconda del tipo di modelli e delle risorse di cui è necessario eseguire il provisioning. Sono disponibili le opzioni di distribuzione seguenti:
- Distribuzione standard nelle risorse Foundry
- Implementazione negli endpoint API serverless
- Distribuzione su risorse di calcolo gestite
Il portale foundry potrebbe scegliere automaticamente un'opzione di distribuzione in base all'ambiente e alla configurazione. Usare le risorse Foundry per la distribuzione quando possibile. I modelli che supportano più opzioni di distribuzione utilizzano per impostazione predefinita le risorse Foundry per la distribuzione. Per accedere ad altre opzioni di distribuzione, usare interfaccia della riga di comando di Azure o Azure Machine Learning SDK per la distribuzione.
Distribuzione standard nelle risorse Foundry
Le risorse foundry sono l'opzione di distribuzione preferita in Foundry. Offre la gamma più ampia di funzionalità, tra cui elaborazione regionale, zona dati o globale, e offre opzioni di velocità effettiva standard e con throughput provisionato. I modelli di punta in Foundry Models supportano questa opzione di distribuzione.
Questa opzione di distribuzione è disponibile in:
- Risorse della fonderia
- risorse di Azure OpenAI1
- Azure AI hub, quando è connesso a una risorsa Foundry
1Se si utilizzano le risorse Azure OpenAI, il catalogo dei modelli mostra solo Azure OpenAI nei modelli di Foundry per la distribuzione. È possibile ottenere l'elenco completo dei modelli Foundry eseguendo l'aggiornamento a una risorsa Foundry.
Per iniziare a usare la distribuzione standard nelle risorse Foundry, vedere Procedura: Distribuire modelli nei modelli Foundry.
Un endpoint dell'API serverless
Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare endpoint dedicati per ospitare il modello, accessibile tramite un'API. I modelli foundry supportano gli endpoint API serverless con fatturazione con pagamento in base al consumo ed è possibile creare solo distribuzioni a livello di area per gli endpoint API serverless.
Per iniziare a usare la distribuzione in un endpoint API serverless, vedere Distribuire i modelli come distribuzioni di API serverless.
Calcolo gestito
Questa opzione di distribuzione è disponibile solo nellerisorse dell'hub di intelligenza artificiale. Consente di creare un endpoint dedicato per ospitare il modello in un ambiente di calcolo dedicato. È necessario disporre di una quota di calcolo nella tua sottoscrizione per ospitare il modello, e la fatturazione avviene in base al tempo di attività computazionale.
La distribuzione di calcolo gestita è necessaria per le raccolte di modelli che includono:
- Hugging Face
- Microservizi di inferenza NVIDIA
- Modelli di settore (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
- Databricks
- Modelli personalizzati
Per iniziare, vedere Come distribuire e dedurre una distribuzione di calcolo gestita e Distribuire i modelli Foundry in un ambiente di calcolo gestito con fatturazione con pagamento in base al consumo.
Funzionalità per le opzioni di distribuzione
Usare le distribuzioni Standard nelle risorse Foundry quando possibile. Questa opzione di distribuzione offre la maggior parte delle funzionalità tra le opzioni di distribuzione disponibili. Nella tabella seguente sono elencati i dettagli sulle funzionalità specifiche per ogni opzione di distribuzione:
| Capacità | Distribuzione standard nelle risorse Foundry | Punto finale API senza server | Calcolo gestito |
|---|---|---|---|
| Quali modelli possono essere distribuiti? |
I Foundry Models venduti direttamente da Azure Modelli di fonderia provenienti da partner e comunità |
Modelli di fonderia con fatturazione a consumo | Aprire e personalizzare i modelli |
| Risorsa di distribuzione | Risorsa Fonderia | Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale) | Progetto di intelligenza artificiale (nella risorsa hub di intelligenza artificiale) |
| Richiede hub di intelligenza artificiale | No | Sì | Sì |
| Opzioni di elaborazione dati | Regionale Zona dati Globale |
Regionale | Regionale |
| Rete privata | Sì | Sì | Sì |
| Filtro del contenuto | Sì | Sì | No |
| Filtro del contenuto personalizzato | Sì | No | No |
| Autenticazione senza chiave | Sì | No | No |
| Basi di fatturazione | Utilizzo dei token e unità di throughput provisionato | Utilizzo dei token2 | Ore core di calcolo3 |
2 La fatturazione di un'infrastruttura endpoint minima avviene al minuto. Non viene addebitato alcun costo per l'infrastruttura che ospita il modello nella distribuzione serverless. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.
3 La fatturazione è al minuto, a seconda del livello prodotto e del numero di istanze usate nella distribuzione dal momento della creazione. Dopo aver eliminato l'endpoint, non verranno accumulati altri addebiti.