Condividi tramite


Distribuire l'estensione per Edge RAG Preview abilitata da Azure Arc

Dopo aver completato i passaggi dei prerequisiti, completare i passaggi descritti in questo articolo per distribuire l'estensione RAG di Edge.

Per provare Edge RAG senza la necessità di hardware locale, vedere Avvio rapido: Installare Edge RAG Preview abilitato da Azure Arc.

Importante

Edge RAG (anteprima) abilitato da Azure Arc è attualmente disponibile in ANTEPRIMA. Vedere le condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure per termini legali aggiuntivi che si applicano a funzionalità di Azure in versione beta, in anteprima o in altro modo non ancora disponibili a livello generale.

Prerequisiti

Prima di iniziare, completare i prerequisiti di distribuzione per Edge RAG Preview.

Distribuzione dell'estensione

Distribuire Edge RAG usando il portale di Azure o l'interfaccia della riga di comando di Azure con un modello linguistico fornito da Microsoft Edge o usando un modello linguistico personalizzato.

  1. Nel portale di Azure, vai al cluster di Azure Kubernetes su Azure Locale.

  2. Selezionare Impostazioni>Estensioni>+ Aggiungi e Edge RAG dall'elenco.

    Screenshot delle estensioni che è possibile aggiungere dal cluster con Edge RAG evidenziato.

  3. Nella scheda Nozioni di base specificare le informazioni seguenti:

    Campo Valore
    Abbonamento Selezionare la sottoscrizione che contiene il cluster del servizio Azure Kubernetes (AKS) su Azure Local.
    Gruppo di risorse Selezionare il gruppo di risorse che contiene il cluster Arc del servizio Azure Kubernetes.
    Nome distribuzione Specificare un nome per la distribuzione.
    Area geografica Selezionare l'area per distribuire Edge RAG.
    Gruppo Selezionare il cluster in cui si vuole distribuire Edge RAG.

    Screenshot della scheda di base con i campi per immettere i dettagli del progetto e dell'istanza.

  4. Selezionare Avanti: Configurazione.

  5. Nella scheda Configurazione specificare le informazioni seguenti:

    Campo Valore
    Modalità di distribuzione Selezionare la modalità GPU o la modalità CPU a seconda dell'hardware disponibile.
    Modello Le informazioni immesse in questa sezione dipendono dal modello linguistico selezionato.
    Origine del modello linguistico Selezionare il modello linguistico da distribuire. Scegliere un modello linguistico fornito da Rag Edge o un modello BYOM (Bring Own Language Model).
    Nome del modello linguistico Se si sceglie di usare un modello fornito, selezionare uno dei modelli linguistici forniti da Rag Edge.
    Aggiungere un modello linguistico personalizzato Se si sceglie di usare un modello linguistico personalizzato, immettere le informazioni seguenti.
    Nome del modello Immettere il nome del modello linguistico.
    Endpoint LLM Immettere il nome dell'endpoint LLM (Large Language Model) nel formato http://some-endpoint o https://some-endpoint. Ad esempio: https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.
    Token max (k) Immettere un intervallo di numeri compreso tra 4K e 2048 K per il modello linguistico.
    Impostazioni SSL
    NOME SSL Specificare il nome di dominio per il sistema. Questo nome di dominio corrisponde all'URI di reindirizzamento fornito durante la registrazione dell'app.
    Nome del segreto SSL di Kubernetes Specificare un nome descrittivo per il segreto SSL da usare dall'applicazione. Per impostazione predefinita, Edge RAG usa un certificato SSL autofirmato per archiviarlo sotto questo nome nell'archivio segreti di Kubernetes. Dopo l'installazione, è possibile aggiornare il certificato con un certificato firmato ufficiale.
    Accedere
    ID app Entra Specificare l'ID applicazione dall'app registrata come parte della configurazione dell'autenticazione (Registrazioni app > La tua app > Panoramica).
    ID tenant Entra Specificare l'ID tenant dall'app che registrata come parte della configurazione dell'autenticazione (Registrazioni app > La tua app > Panoramica).

    Screenshot della scheda di configurazione in cui si seleziona il tipo di modello e altre configurazioni.

  6. Selezionare Rivedi e crea.

  7. Esaminare e convalidare i parametri specificati.

  8. Selezionare Crea per completare la distribuzione di Edge RAG.

  9. Al termine della distribuzione, in Estensioni verificare che siano elencati i tipi di estensione microsoft.arc.rag e microsoft.extensiondiagnostics .

La distribuzione dell'estensione Rag Edge richiede in genere circa 30 minuti, ma può richiedere più tempo a seconda della connettività.

Porta il tuo modello di linguaggio

Se è stato aggiunto un modello linguistico personalizzato quando è stata distribuita l'estensione Edge RAG, completare la procedura descritta in Configurare l'autenticazione endpoint "BYOM" per Edge RAG.