Implementeringsalternativ för AI i Azure-infrastruktur
Den här artikeln innehåller implementeringsrekommendationer för organisationer som kör AI-arbetsbelastningar i Azure-infrastrukturen (IaaS). När du har distribuerat en Azure-landningszon kan du konfigurera programlandningszonen med hjälp av CycleCloud-arbetsytan för Slurm. Azure CycleCloud-arbetsytan för Slurm erbjuder flera fördelar för användare som vill köra AI-arbetsbelastningar med Slurm-schemaläggaren.
Enkelt och snabbt att skapa kluster. Användare kan snabbt skapa Slurm-kluster i Azure via ett enkelt GUI. De kan välja mellan olika storlekar och typer av virtuella Azure-datorer och anpassa klusterinställningar som antal noder, nätverkskonfiguration, lagringsalternativ (till exempel Azure NetApp Files och Azure Managed Lustre Filesystem) och Slurm-parametrar.
Flexibel och dynamisk klusterhantering. Azure CycleCloud skalar upp eller ned Slurm-kluster automatiskt. Användare kan övervaka klusterstatus, prestanda och användning samt visa loggar och mått via användargränssnittet. De kan ta bort kluster när de inte behövs och endast betala för de resurser de använder.
Fullständig kontroll över infrastrukturen. Användarna har fullständig kontroll över den distribuerade infrastrukturen, så att de kan ta med egen kod, bibliotek och paket och använda resurser på begäran.
Designriktlinjer
Följande artiklar innehåller riktlinjer för AI-arbetsbelastningar i Azure-infrastrukturen (IaaS):
Arkitektur
Bild 1. AI-program på Azure-infrastrukturen i Azure-landningszonen.
Distribuera CycleCloud-arbetsyta för Slurm
CycleCloud-arbetsytan för Slurm kan användas som den första distributionen i företagsmiljön. Du kan utveckla och anpassa koden för att utöka dess funktioner och/eller anpassa den till din Azure-landningszonmiljö. Följ sedan vägledningen för att finjustera en diffusionsmodell från Hugging Face med hjälp av Azure CycleCloud Workspace for Slurm.