Udostępnij za pośrednictwem


Wdrażanie rozszerzenia dla programu Edge RAG w wersji zapoznawczej włączonej przez usługę Azure Arc

Po wykonaniu kroków wymagań wstępnych wykonaj kroki opisane w tym artykule, aby wdrożyć rozszerzenie EDGE RAG.

Ważne

Edge RAG (wersja zapoznawcza) włączona przez usługę Azure Arc jest obecnie dostępna w wersji zapoznawczej. Zobacz dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure, aby zapoznać się z postanowieniami prawnymi dotyczącymi funkcji platformy Azure, które są w wersji beta, wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej.

Wymagania wstępne

Przed rozpoczęciem należy spełnić wymagania wstępne wdrożenia dla wersji zapoznawczej programu Edge RAG.

Wdrażanie rozszerzenia

Wdróż Edge RAG przy użyciu Azure portal lub Azure CLI z dostarczonym przez Microsoft modelem językowym lub dodaj własny model językowy.

  1. W witrynie Azure Portal przejdź do klastra Usługi Azure Kubernetes w środowisku lokalnym platformy Azure.

  2. Wybierz Ustawienia>Rozszerzenia>+ Dodaj i Edge RAG z listy.

    Zrzut ekranu przedstawiający rozszerzenia, które można dodać z klastra, z wyróżnionym Edge RAG.

  3. Na karcie Podstawowe podaj następujące informacje:

    (No changes needed) Wartość
    Subskrypcja Wybierz subskrypcję zawierającą klaster usługi Azure Kubernetes Service (AKS) w środowisku lokalnym platformy Azure.
    Grupa zasobów Wybierz grupę zasobów zawierającą klaster usługi AKS Arc.
    Nazwa wdrożenia Podaj nazwę wdrożenia.
    Rejon Wybierz region, w którym chcesz wdrożyć program Edge RAG.
    Klaster Wybierz klaster, do którego chcesz wdrożyć program Edge RAG.

    Zrzut ekranu przedstawiający kartę podstawową z polami umożliwiającymi wprowadzenie szczegółów projektu i instancji.

  4. Wybierz Dalej: Konfiguracja.

  5. Na karcie Konfiguracja podaj następujące informacje:

    (No changes needed) Wartość
    Tryb wdrażania Wybierz tryb procesora GPU lub tryb procesora CPU w zależności od dostępnego sprzętu.
    Model Informacje wprowadzone w tej sekcji zależą od wybranego modelu językowego.
    Model językowy Wybierz model językowy, który chcesz wdrożyć. Wybierz model językowy udostępniony przez Microsoft lub własny.
    Model językowy firmy Microsoft Jeśli wybrano pozycję Firma Microsoft, wybierz jeden z udostępnionych modeli językowych firmy Microsoft.
    Dodawanie własnego modelu językowego Jeśli zdecydujesz się na podanie własnego modelu językowego, wprowadź następujące informacje.
    Nazwa modelu Wprowadź nazwę modelu językowego.
    Punkt końcowy usługi LLM Wprowadź nazwę punktu końcowego dużego modelu językowego (LLM) w formacie http://some-endpoint lub https://some-endpoint. Na przykład https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.
    Maksymalny token (k) Wprowadź zakres liczb z zakresu od 4K do 2048 K dla modelu językowego.
    Ustawienia protokołu SSL
    SSL CNAME Podaj nazwę domeny dla systemu. Ta nazwa domeny jest taka sama jak podany identyfikator URI przekierowania podczas rejestracji aplikacji.
    Nazwa sekretu SSL w Kubernetes Podaj przyjazną nazwę tajnego klucza SSL, który ma być używany przez aplikację. Domyślnie usługa Edge RAG używa certyfikatu SSL z podpisem własnym do przechowywania pod tą nazwą w magazynie tajemnic Kubernetes. Po zakończeniu instalacji można zaktualizować certyfikat za pomocą oficjalnego podpisanego certyfikatu.
    Uzyskaj dostęp
    Identyfikator aplikacji Entra Podaj identyfikator aplikacji z aplikacji zarejestrowanej w ramach konfigurowania uwierzytelniania (Rejestracje > aplikacji Przegląd aplikacji > ).
    Identyfikator najemcy Entra Podaj identyfikator dzierżawy z aplikacji zarejestrowanej w ramach konfigurowania uwierzytelniania (Rejestracje > aplikacji Przegląd aplikacji > ).

    Zrzut ekranu przedstawiający kartę konfiguracji, na której wybierasz typ modelu i inne konfiguracje.

  6. Wybierz Dalej: Przejrzyj i utwórz.

  7. Przejrzyj i zweryfikuj podane parametry.

  8. Wybierz pozycję Utwórz , aby ukończyć wdrażanie programu Edge RAG.

  9. Po zakończeniu wdrażania, pod Rozszerzenia, sprawdź, czy wyświetlane są typy rozszerzeń microsoft.arc.rag i microsoft.extensiondiagnostics.

Wdrożenie rozszerzenia EDGE RAG zwykle trwa około 30 minut, ale może trwać dłużej w zależności od łączności.

Dodawanie własnego modelu językowego

Jeśli podczas wdrażania rozszerzenia EDGE RAG dodano własny model językowy, wykonaj kroki opisane w temacie Konfigurowanie uwierzytelniania punktu końcowego "BYOM" dla programu Edge RAG.