Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Po wykonaniu kroków wymagań wstępnych wykonaj kroki opisane w tym artykule, aby wdrożyć rozszerzenie EDGE RAG.
Ważne
Edge RAG (wersja zapoznawcza) włączona przez usługę Azure Arc jest obecnie dostępna w wersji zapoznawczej. Zobacz dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure, aby zapoznać się z postanowieniami prawnymi dotyczącymi funkcji platformy Azure, które są w wersji beta, wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej.
Wymagania wstępne
Przed rozpoczęciem należy spełnić wymagania wstępne wdrożenia dla wersji zapoznawczej programu Edge RAG.
Wdrażanie rozszerzenia
Wdróż Edge RAG przy użyciu Azure portal lub Azure CLI z dostarczonym przez Microsoft modelem językowym lub dodaj własny model językowy.
W witrynie Azure Portal przejdź do klastra Usługi Azure Kubernetes w środowisku lokalnym platformy Azure.
Wybierz Ustawienia>Rozszerzenia>+ Dodaj i Edge RAG z listy.
Na karcie Podstawowe podaj następujące informacje:
(No changes needed) Wartość Subskrypcja Wybierz subskrypcję zawierającą klaster usługi Azure Kubernetes Service (AKS) w środowisku lokalnym platformy Azure. Grupa zasobów Wybierz grupę zasobów zawierającą klaster usługi AKS Arc. Nazwa wdrożenia Podaj nazwę wdrożenia. Rejon Wybierz region, w którym chcesz wdrożyć program Edge RAG. Klaster Wybierz klaster, do którego chcesz wdrożyć program Edge RAG. Wybierz Dalej: Konfiguracja.
Na karcie Konfiguracja podaj następujące informacje:
(No changes needed) Wartość Tryb wdrażania Wybierz tryb procesora GPU lub tryb procesora CPU w zależności od dostępnego sprzętu. Model Informacje wprowadzone w tej sekcji zależą od wybranego modelu językowego. Model językowy Wybierz model językowy, który chcesz wdrożyć. Wybierz model językowy udostępniony przez Microsoft lub własny. Model językowy firmy Microsoft Jeśli wybrano pozycję Firma Microsoft, wybierz jeden z udostępnionych modeli językowych firmy Microsoft. Dodawanie własnego modelu językowego Jeśli zdecydujesz się na podanie własnego modelu językowego, wprowadź następujące informacje. Nazwa modelu Wprowadź nazwę modelu językowego. Punkt końcowy usługi LLM Wprowadź nazwę punktu końcowego dużego modelu językowego (LLM) w formacie http://some-endpoint
lubhttps://some-endpoint
. Na przykładhttps://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>
.Maksymalny token (k) Wprowadź zakres liczb z zakresu od 4K do 2048 K dla modelu językowego. Ustawienia protokołu SSL SSL CNAME Podaj nazwę domeny dla systemu. Ta nazwa domeny jest taka sama jak podany identyfikator URI przekierowania podczas rejestracji aplikacji. Nazwa sekretu SSL w Kubernetes Podaj przyjazną nazwę tajnego klucza SSL, który ma być używany przez aplikację. Domyślnie usługa Edge RAG używa certyfikatu SSL z podpisem własnym do przechowywania pod tą nazwą w magazynie tajemnic Kubernetes. Po zakończeniu instalacji można zaktualizować certyfikat za pomocą oficjalnego podpisanego certyfikatu. Uzyskaj dostęp Identyfikator aplikacji Entra Podaj identyfikator aplikacji z aplikacji zarejestrowanej w ramach konfigurowania uwierzytelniania (Rejestracje > aplikacji Przegląd aplikacji > ). Identyfikator najemcy Entra Podaj identyfikator dzierżawy z aplikacji zarejestrowanej w ramach konfigurowania uwierzytelniania (Rejestracje > aplikacji Przegląd aplikacji > ). Wybierz Dalej: Przejrzyj i utwórz.
Przejrzyj i zweryfikuj podane parametry.
Wybierz pozycję Utwórz , aby ukończyć wdrażanie programu Edge RAG.
Po zakończeniu wdrażania, pod Rozszerzenia, sprawdź, czy wyświetlane są typy rozszerzeń microsoft.arc.rag i microsoft.extensiondiagnostics.
Wdrożenie rozszerzenia EDGE RAG zwykle trwa około 30 minut, ale może trwać dłużej w zależności od łączności.
Dodawanie własnego modelu językowego
Jeśli podczas wdrażania rozszerzenia EDGE RAG dodano własny model językowy, wykonaj kroki opisane w temacie Konfigurowanie uwierzytelniania punktu końcowego "BYOM" dla programu Edge RAG.