Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Annotazioni
Questo documento fa riferimento al portale di Microsoft Foundry (versione classica).
🔍Per informazioni sul nuovo portale, vedere la documentazione di Microsoft Foundry (nuova).
Questo articolo illustra come sviluppare un'applicazione di intelligenza artificiale generativa partendo da GitHub Models e quindi aggiornare l'esperienza distribuendo una risorsa Foundry Tools con i modelli di Microsoft Foundry.
I modelli GitHub sono utili quando si vuole trovare e sperimentare gratuitamente i modelli di intelligenza artificiale durante lo sviluppo di un'applicazione di intelligenza artificiale generativa. Quando si è pronti per portare l'applicazione in produzione, migliorare la tua esperienza distribuendo una risorsa di Foundry Tools in una sottoscrizione di Azure e iniziare a usare i Modelli Foundry. Non è necessario modificare altri elementi nel codice.
Il playground e l'utilizzo gratuito dell'API per i modelli GitHub sono limitati dalle richieste al minuto, dalle richieste al giorno, dai token per richiesta e dalle richieste simultanee. Se la frequenza viene limitata, è necessario attendere la reimpostazione del limite di frequenza raggiunto prima di poter effettuare più richieste.
Prerequisiti
È necessario:
- Un account GitHub con accesso a GitHub Models.
- Una sottoscrizione di Azure con un metodo di pagamento valido. Se non si dispone di una sottoscrizione di Azure, è possibile creare un account Azure gratuito per iniziare. In alternativa, è possibile attendere fino a quando non si è pronti per distribuire il modello nell'ambiente di produzione, a questo punto verrà richiesto di creare o aggiornare l'account Azure a un account standard.
- I modelli Foundry di partner e community richiedono l'accesso ad Azure Marketplace. Assicurarsi di disporre delle autorizzazioni necessarie per iscriversi alle offerte modello. I Modelli Foundry venduti direttamente da Azure non hanno questo requisito.
Aggiornare ai modelli fonderia
I limiti di frequenza per il playground e l'utilizzo gratuito dell'API consentono di sperimentare i modelli e sviluppare l'applicazione di intelligenza artificiale. Quando si è pronti per portare l'applicazione in produzione, usare una chiave e un endpoint da un account Azure a pagamento. Non è necessario modificare altri elementi nel codice.
Annotazioni
I modelli GitHub sono gratuiti con limiti di frequenza. Dopo l'aggiornamento ai modelli Foundry, l'utilizzo viene fatturato alla sottoscrizione di Azure in base al tipo di distribuzione scelto.
Per ottenere la chiave e l'endpoint:
Passare a GitHub Models (Modelli GitHub) e selezionare un modello per atterrare nel relativo ambiente di gioco. Questo articolo usa Mistral Medium 3 (25.05).
Digitare alcune richieste o usare alcune delle richieste suggerite per interagire con il modello nel playground.
Selezionare Usa questo modello dall'area di prova. Questa azione apre una finestra in "Introduzione ai modelli nella codebase".
Nel passaggio "Configure authentication" (Configura autenticazione) selezionare Get Microsoft Foundry key (Ottieni la chiave Microsoft Foundry ) nella sezione "Azure AI".
Se si è già eseguito l'accesso all'account Azure, ignorare questo passaggio. Tuttavia, se non si ha un account Azure o non si è connessi all'account, seguire questa procedura:
Se non si ha un account Azure, selezionare Crea account personale e seguire i passaggi per crearne uno.
In alternativa, se si ha un account Azure, selezionare Accedi di nuovo. Se l'account esistente è un account gratuito, è prima necessario eseguire l'aggiornamento a un piano standard.
Tornare al playground del modello e selezionare di nuovo Recupera chiave Microsoft Foundry .
Accedere all'account di Azure.
Sei portato a Foundry > GitHub e arrivi alla home page di un progetto Foundry.
Suggerimento
Se si accede all'esperienza Foundry (classica), utilizzare l'interruttore New Foundry nell'angolo in alto a destra per passare alla nuova esperienza Foundry.
Seguire la procedura descritta in Distribuire un modello per distribuire il modello preferito, testarlo in Playground e dedurre il modello distribuito con codice.
Verificare che la distribuzione funzioni inviando una richiesta di test in Playground. Se si riceve una risposta, il modello è pronto per l'uso dal codice.
Importante
A differenza dei modelli GitHub in cui tutti i modelli sono già configurati, la risorsa Foundry Tools consente di controllare quali modelli sono disponibili nell'endpoint e in quale configurazione. Aggiungere tutti i modelli che si prevede di usare prima di indicarli nel model parametro . Informazioni su come aggiungere altri modelli alla risorsa.
Esplorare funzionalità aggiuntive
I modelli foundry supportano funzionalità non disponibili nei modelli GitHub:
- Catalogo dei modelli: esplorare, confrontare e valutare modelli di Azure, partner e community open source.
- Autenticazione senza chiave : usare Microsoft Entra ID per l'autenticazione basata su token senza gestire le chiavi API.
- Filtro del contenuto : configurare i filtri di sicurezza del contenuto per le distribuzioni.
- Limitazione della frequenza : impostare limiti di frequenza personalizzati per modelli specifici nella risorsa.
- Tipi di distribuzione : scegliere tra più SKU di distribuzione, ad esempio con pagamento in base al token, provisioning e batch.
Risolvere i problemi comuni
| Problema | Risoluzione |
|---|---|
| Modello non disponibile nell'area | Controllare la disponibilità dell'area del modello nella pagina del catalogo dei modelli e scegliere un'area supportata. |
| Errore di autenticazione dopo lo scambio di chiavi | Verificare di aver copiato la chiave corretta dal portale di Foundry. Selezionare Impostazioni del progetto>Chiavi ed endpoint per visualizzare le chiavi. |
| Errori di limite di frequenza dopo l'aggiornamento | I limiti di frequenza dei modelli foundry dipendono dal tipo di distribuzione. Aumentare la capacità o scegliere una distribuzione a maggiore throughput. |