Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
In dit artikel leert u hoe u een container-app maakt die gebruikmaakt van serverloze GPU's om een AI-toepassing uit te voeren.
Met serverloze GPU's hebt u directe toegang tot GPU-rekenresources zonder dat u handmatige infrastructuurconfiguratie hoeft uit te voeren, zoals het installeren van stuurprogramma's. Het enige dat u hoeft te doen, is de afbeelding van uw AI-model implementeren.
In deze tutorial doet u het volgende:
- Een nieuwe container-app en -omgeving maken
- De omgeving configureren voor het gebruik van serverloze GPU's
- Uw app implementeren in Azure Container Apps
- De nieuwe serverloze GPU-toepassing gebruiken
- Artefactstreaming inschakelen om de koude start van GPU te verminderen
Prerequisites
| Resource | Description |
|---|---|
| Azure-account | U hebt een Azure-account met een actief abonnement nodig. Als u geen account hebt, kunt u er gratis een maken. |
| Toegang tot serverloze GPU's | Toegang tot GPU's is alleen beschikbaar nadat u GPU-quota hebt aangevraagd. U kunt uw GPU-quotumaanvraag indienen via een klantondersteuningsaanvraag. |
| Resource | Description |
|---|---|
| Azure-account | U hebt een Azure-account met een actief abonnement nodig. Als u geen account hebt, kunt u er gratis een maken. |
| Toegang tot serverloze GPU's | Toegang tot GPU's is alleen beschikbaar nadat u GPU-quota hebt aangevraagd. U kunt uw GPU-quotumaanvraag indienen via een klantondersteuningsaanvraag. |
| Azure-CLI | Installeer de Azure CLI of voer een upgrade uit naar de nieuwste versie. |
Uw container-app maken
Ga naar Azure Portal en zoek en selecteer Container Apps.
Selecteer Maken en selecteer vervolgens Container App.
Voer in het venster Basisinformatie de volgende waarden in elke sectie in.
Voer onder Projectdetails de volgende waarden in:
Setting Value Subscription Selecteer uw Azure-abonnement. Bronnengroep Selecteer Nieuwe maken en voer mijn-gpu-demogroep in. Naam container-app Voer mijn-gpu-demo-app in. Implementatiebron Selecteer Containerinstallatiekopieën. Voer onder Container Apps-omgeving de volgende waarden in:
Setting Value Region Selecteer Zweden - centraal.
Raadpleeg voor meer ondersteunde regio's het gebruik van serverloze GPU's in Azure.Container Apps-omgeving Selecteer Nieuw maken. Voer in het venster Container Apps-omgeving maken de volgende waarden in:
Setting Value Naam van de omgeving Voer mijn-gpu-demo-env in. Klik op Creëren.
Selecteer Volgende: Container >.
Voer in het venster Container de volgende waarden in:
Setting Value Name Voer my-gpu-demo-container in. Afbeeldingsbron Selecteer Docker Hub of andere registers. Afbeeldingstype Selecteer openbaar. Registeraanmeldingsserver Voer mcr.microsoft.com in. Afbeelding en tag Voer k8se/gpu-quickstart:latest in. Werkbelasting profiel Selecteer Verbruik - Maximaal 4 vCPU's, 8 Gib-geheugen. GPU Schakel het selectievakje in. GPU-type Selecteer Consumption-GPU-NC8as-T4 - Maximaal 8 vCPU's, 56 GiB-geheugen en selecteer de koppeling om het profiel toe te voegen aan uw omgeving. Selecteer Volgende: Ingress >.
Voer in het venster Ingress de volgende waarden in:
Setting Value Ingress Schakel het selectievakje Ingeschakeld in . Inkomend verkeer Selecteer het keuzerondje Verkeer accepteren van overal. Bestemmingspoort Voer 80 in. Kies Beoordelen + creëren.
Klik op Creëren.
Wacht even totdat de implementatie is voltooid en selecteer vervolgens Ga naar de resource.
Het kan vijf minuten duren voordat dit proces is voltooid.
Uw GPU-app gebruiken
Selecteer in het venster Overzicht de koppeling Toepassings-URL om de front-end van de web-app in uw browser te openen en de GPU-toepassing te gebruiken.
Note
- Als u de beste prestaties van uw GPU-apps wilt bereiken, volgt u de stappen om de koude start voor uw serverloze GPU's te verbeteren.
- Wanneer uw toepassing meerdere containers bevat, krijgt de eerste container toegang tot de GPU.
Omgevingsvariabelen maken
Definieer de volgende omgevingsvariabelen. Voordat u deze opdracht uitvoert, vervangt u de <PLACEHOLDERS> door uw waarde.
RESOURCE_GROUP="<RESOURCE_GROUP>"
ENVIRONMENT_NAME="<ENVIRONMENT_NAME>"
LOCATION="swedencentral"
CONTAINER_APP_NAME="<CONTAINER_APP_NAME>"
CONTAINER_IMAGE="mcr.microsoft.com/k8se/gpu-quickstart:latest"
WORKLOAD_PROFILE_NAME="NC8as-T4"
WORKLOAD_PROFILE_TYPE="Consumption-GPU-NC8as-T4"
Uw container-app maken
Maak een resourcegroep aan die de resources bevat die u in deze handleiding aanmaakt. Deze opdracht zou
Succeededmoeten uitvoeren.az group create \ --name $RESOURCE_GROUP \ --location $LOCATION \ --query "properties.provisioningState"Maak een Container Apps-omgeving om uw container-app te hosten. Deze opdracht zou
Succeededmoeten uitvoeren.az containerapp env create \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --location "$LOCATION" \ --query "properties.provisioningState"Voeg een workloadprofiel toe aan uw omgeving.
az containerapp env workload-profile add \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --workload-profile-type $WORKLOAD_PROFILE_TYPEMaak uw container-app.
az containerapp create \ --name $CONTAINER_APP_NAME \ --resource-group $RESOURCE_GROUP \ --environment $ENVIRONMENT_NAME \ --image $CONTAINER_IMAGE \ --target-port 80 \ --ingress external \ --cpu 8.0 \ --memory 56.0Gi \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --query properties.configuration.ingress.fqdnMet deze opdracht wordt de toepassings-URL voor uw container-app uitgevoerd.
Uw GPU-app gebruiken
Open de toepassings-URL voor uw container-app in uw browser. Houd er rekening mee dat het maximaal vijf minuten kan duren voordat de container-app is opgestart.
Met de Azure Container Apps-toepassing met serverloze GPU's kunt u een prompt invoeren om een afbeelding te genereren. U kunt ook gewoon selecteren Generate Image om de standaardprompt te gebruiken. In de volgende stap bekijkt u de resultaten van de GPU-verwerking.
Note
- Als u de beste prestaties van uw GPU-apps wilt bereiken, volgt u de stappen om de koude start voor uw serverloze GPU's te verbeteren.
- Wanneer uw toepassing meerdere containers bevat, krijgt de eerste container toegang tot de GPU.
Uw GPU bewaken
Zodra u een afbeelding hebt gegenereerd, volgt u de volgende stappen om de resultaten van de GPU-verwerking te bekijken:
Open uw container-app in Azure Portal.
Vanuit de sectie Bewaking, selecteer Console.
Selecteer de replica.
Selecteer de container.
Selecteer Opnieuw verbinding maken.
In het venster Opstartopdracht kiezen, selecteer /bin/bash en selecteer Verbinden.
Nadat de shell is ingesteld, voert u de opdracht nvidia-smi in om de status en uitvoer van uw GPU te controleren.
De hulpbronnen opschonen
De resources die in deze zelfstudie zijn gemaakt, hebben een effect op uw Azure-factuur.
Als u deze services niet op de lange termijn gaat gebruiken, gebruikt u de stappen om alles te verwijderen dat in deze zelfstudie is gemaakt.
Zoek en selecteer resourcegroepen in Azure Portal.
Selecteer mijn-gpu-demogroep.
Selecteer Resourcegroep verwijderen.
Voer in het bevestigingsvak mijn-gpu-demogroep in.
Selecteer Verwijderen.
Voer de volgende opdracht uit.
az group delete --name $RESOURCE_GROUP