Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Z tego artykułu dowiesz się, jak utworzyć aplikację kontenera, która używa bezserwerowych procesorów GPU do zasilania aplikacji sztucznej inteligencji.
W przypadku bezserwerowych procesorów GPU masz bezpośredni dostęp do zasobów obliczeniowych procesora GPU bez konieczności ręcznej konfiguracji infrastruktury, takiej jak instalowanie sterowników. Wystarczy wdrożyć obraz modelu sztucznej inteligencji.
W tym samouczku wykonasz następujące elementy:
- Tworzenie nowej aplikacji kontenera i środowiska
- Konfigurowanie środowiska do używania bezserwerowych procesorów GPU
- Wdrażanie aplikacji w usłudze Azure Container Apps
- Korzystanie z nowej bezserwerowej aplikacji obsługującej procesor GPU
- Włączanie przesyłania strumieniowego artefaktów w celu zmniejszenia zimnego startu procesora GPU
Wymagania wstępne
| Zasób | opis |
|---|---|
| Konto platformy Azure | Potrzebujesz konta platformy Azure z aktywną subskrypcją. Jeśli nie masz konta, możesz je utworzyć teraz za darmo. |
| Dostęp do bezserwerowych procesorów GPU | Dostęp do procesorów GPU jest dostępny tylko po żądaniu limitów przydziału procesora GPU. Żądanie limitu przydziału procesora GPU można przesłać za pośrednictwem zgłoszenia do pomocy technicznej klienta. |
| Zasób | opis |
|---|---|
| Konto platformy Azure | Potrzebujesz konta platformy Azure z aktywną subskrypcją. Jeśli nie masz konta, możesz je utworzyć teraz za darmo. |
| Dostęp do bezserwerowych procesorów GPU | Dostęp do procesorów GPU jest dostępny tylko po żądaniu limitów przydziału procesora GPU. Żądanie limitu przydziału procesora GPU można przesłać za pośrednictwem zgłoszenia do pomocy technicznej klienta. |
| "Azure CLI" | Zainstaluj interfejs wiersza polecenia platformy Azure lub uaktualnij go do najnowszej wersji. |
Tworzenie aplikacji kontenera
Przejdź do witryny Azure Portal i wyszukaj i wybierz pozycję Aplikacje kontenera.
Wybierz pozycję Utwórz , a następnie wybierz pozycję Aplikacja kontenera.
W oknie Podstawy wprowadź następujące wartości w każdej sekcji.
W obszarze Szczegóły projektu wprowadź następujące wartości:
Ustawienie Wartość Subskrypcja Wybierz subskrypcję platformy Azure. Grupa zasobów Wybierz pozycję Utwórz nowy i wprowadź ciąg my-gpu-demo-group. Nazwa aplikacji kontenera Wprowadź ciąg my-gpu-demo-app. Źródło wdrożenia Wybierz pozycję Obraz kontenera. W obszarze Środowisko usługi Container Apps wprowadź następujące wartości:
Ustawienie Wartość Region (Region) Wybierz pozycję Szwecja Środkowa.
Aby uzyskać więcej obsługiwanych regionów, zobacz Używanie bezserwerowych procesorów GPU na platformie Azure.Środowisko usługi Container Apps Wybierz pozycjęUtwórz nowy. W oknie Tworzenie środowiska usługi Container Apps wprowadź następujące wartości:
Ustawienie Wartość Nazwa środowiska Wprowadź ciąg my-gpu-demo-env. Wybierz pozycję Utwórz.
Wybierz pozycję Dalej: Kontener >.
W oknie Kontener wprowadź następujące wartości:
Ustawienie Wartość Nazwisko Wprowadź ciąg my-gpu-demo-container. Źródło obrazu Wybierz pozycję Docker Hub lub inne rejestry. Typ obrazu Wybierz pozycję publiczne. Serwer logowania rejestru Wprowadź mcr.microsoft.com. Obraz i tag Wprowadź ciąg k8se/gpu-quickstart:latest. Profil obciążenia Wybierz Konfigurację — do 4 vCPU, 8 GiB pamięci. procesor GPU Zaznacz pole wyboru. Typ procesora GPU Wybierz Consumption-GPU-NC8as-T4 — do 8 vCPU, 56 GiB pamięci i wybierz link, aby dodać profil do swojego środowiska. Wybierz pozycję Dalej: Ruch przychodzący >.
W oknie Ruch przychodzący wprowadź następujące wartości:
Ustawienie Wartość Ruch przychodzący Zaznacz pole wyboru Włączone. Ruch przychodzący Wybierz przycisk radiowy Akceptowanie ruchu z dowolnego miejsca. Port docelowy Wprowadź wartość 80. Wybierz pozycję Przejrzyj i utwórz.
Wybierz pozycję Utwórz.
Poczekaj chwilę na zakończenie wdrożenia, a następnie wybierz pozycję Przejdź do zasobu.
Wykonanie tego procesu może potrwać do pięciu minut.
Korzystanie z aplikacji procesora GPU
W oknie Przegląd wybierz link Adres URL aplikacji, aby otworzyć fronton aplikacji internetowej w przeglądarce i użyć aplikacji procesora GPU.
Uwaga
- Aby uzyskać najlepszą wydajność aplikacji procesora GPU, wykonaj kroki, aby poprawić zimny start dla bezserwerowych procesorów GPU.
- Jeśli w aplikacji znajduje się wiele kontenerów, pierwszy kontener uzyskuje dostęp do procesora GPU.
Tworzenie zmiennych środowiskowych
Zdefiniuj następujące zmienne środowiskowe. Przed uruchomieniem tego polecenia zastąp element <PLACEHOLDERS> swoimi wartościami.
RESOURCE_GROUP="<RESOURCE_GROUP>"
ENVIRONMENT_NAME="<ENVIRONMENT_NAME>"
LOCATION="swedencentral"
CONTAINER_APP_NAME="<CONTAINER_APP_NAME>"
CONTAINER_IMAGE="mcr.microsoft.com/k8se/gpu-quickstart:latest"
WORKLOAD_PROFILE_NAME="NC8as-T4"
WORKLOAD_PROFILE_TYPE="Consumption-GPU-NC8as-T4"
Tworzenie aplikacji kontenera
Utwórz grupę zasobów, aby mogła pomieścić zasoby, które utworzysz w tym samouczku. To polecenie powinno wyświetlić dane wyjściowe
Succeeded.az group create \ --name $RESOURCE_GROUP \ --location $LOCATION \ --query "properties.provisioningState"Utwórz środowisko usługi Container Apps do hostowania aplikacji kontenera. To polecenie powinno wyświetlić dane wyjściowe
Succeeded.az containerapp env create \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --location "$LOCATION" \ --query "properties.provisioningState"Dodaj profil obciążenia do swojego środowiska.
az containerapp env workload-profile add \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --workload-profile-type $WORKLOAD_PROFILE_TYPEUtwórz aplikację kontenera.
az containerapp create \ --name $CONTAINER_APP_NAME \ --resource-group $RESOURCE_GROUP \ --environment $ENVIRONMENT_NAME \ --image $CONTAINER_IMAGE \ --target-port 80 \ --ingress external \ --cpu 8.0 \ --memory 56.0Gi \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --query properties.configuration.ingress.fqdnTo polecenie zwraca adres URL aplikacji dla aplikacji kontenera.
Korzystanie z aplikacji procesora GPU
Otwórz adres URL aplikacji dla aplikacji kontenera w przeglądarce. Pamiętaj, że uruchomienie aplikacji kontenera może potrwać do pięciu minut.
Aplikacja Azure Container Apps z bezserwerowymi procesorami GPU umożliwia wprowadzenie monitu o wygenerowanie obrazu. Możesz również po prostu wybrać, Generate Image aby użyć domyślnego monitu. W następnym kroku wyświetlisz wyniki przetwarzania procesora GPU.
Uwaga
- Aby uzyskać najlepszą wydajność aplikacji procesora GPU, wykonaj kroki, aby poprawić zimny start dla bezserwerowych procesorów GPU.
- Jeśli w aplikacji znajduje się wiele kontenerów, pierwszy kontener uzyskuje dostęp do procesora GPU.
Monitorowanie procesora GPU
Po wygenerowaniu obrazu wykonaj następujące kroki, aby wyświetlić wyniki przetwarzania procesora GPU:
Otwórz aplikację kontenera w witrynie Azure Portal.
W sekcji Monitorowanie wybierz pozycję Konsola.
Wybierz replikę.
Wybierz kontener.
Wybierz pozycję Połącz ponownie.
W oknie Wybieranie polecenia uruchamiania wybierz pozycję /bin/bash, a następnie wybierz pozycję Połącz.
Po skonfigurowaniu powłoki wprowadź polecenie nvidia-smi , aby przejrzeć stan i dane wyjściowe procesora GPU.
Czyszczenie zasobów
Zasoby utworzone w tym samouczku mają wpływ na rachunek za platformę Azure.
Jeśli nie zamierzasz korzystać z tych usług w perspektywie długoterminowej, wykonaj kroki, aby usunąć wszystkie elementy utworzone w tym samouczku.
W witrynie Azure Portal wyszukaj i wybierz pozycję Grupy zasobów.
Wybierz pozycję my-gpu-demo-group.
Wybierz pozycję Usuń grupę zasobów.
W polu potwierdzenia wprowadź ciąg my-gpu-demo-group.
Wybierz Usuń.
Uruchom następujące polecenie.
az group delete --name $RESOURCE_GROUP