Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Dit artikel bevat een overzicht van het organisatieproces voor het bouwen van AI-workloads in Azure. Het artikel bevat aanbevelingen voor het maken van belangrijke ontwerp- en procesbeslissingen voor het op schaal nemen van AI-workloads. Het richt zich op AI-specifieke richtlijnen voor de organisatie en connectiviteit van resources.
Governancegrenzen voor AI-workloads vaststellen
AI-governance vereist de juiste organisatie van resources en beleidsbeheer om veilige, compatibele en rendabele bewerkingen te garanderen. U moet duidelijke governancegrenzen maken om gevoelige gegevens te beveiligen en de toegang tot AI-resources effectief te beheren. U doet dit als volgt:
Maak afzonderlijke beheergroepen voor internetgerichte en interne AI-workloads. Scheiding van beheergroepen brengt kritieke grenzen voor gegevensbeheer tot stand tussen externe (online) en INTERNE AI-toepassingen ('alleen zakelijk'). Deze scheiding voorkomt dat externe gebruikers toegang krijgen tot gevoelige interne bedrijfsgegevens terwijl u de juiste toegangscontroles onderhoudt. De benadering is afgestemd op de architectuurprincipes van Azure landing zone managementgroepen en ondersteunt beleidserfenis tussen workloadtypes.
AI-specifieke beleidsregels toepassen op elke beheergroep. Begin met basislijnbeleid van Azure-landingszones en voeg Azure Policy-definities toe voor Azure AI Foundry, Azure AI-services, Azure AI Search en Azure Virtual Machines. Beleidshandhaving zorgt voor uniforme AI-governance op uw platform en vermindert handmatig nalevingstoezicht.
AI-resources uitrollen binnen workload-specifieke abonnementen. AI-resources moeten governancebeleid overnemen van hun workloadbeheergroep in plaats van platformabonnementen. Deze scheiding voorkomt ontwikkelknelpunten die worden veroorzaakt door de controles van het platformteam en stelt workloadteams in staat om met de juiste autonomie te opereren. AI-workloads uitrollen naar applicatie landingszone-abonnementen in Azure-landingszone omgevingen.
Veilige connectiviteit voor AI-workloads tot stand brengen
AI-netwerken omvatten ontwerp, beveiligingsmaatregelen en efficiënte patronen voor gegevensoverdracht voor AI-workloads. U moet de juiste beveiligingscontroles en connectiviteitsopties implementeren om onderbrekingen in het netwerk te voorkomen en consistente prestaties te behouden. U doet dit als volgt:
Activeer Azure DDoS Protection voor internetgerichte AI-workloads.Azure DDoS Protection beschermt uw AI-services tegen mogelijke onderbrekingen en downtime die gedistribueerde Denial of Service-aanvallen veroorzaken. DDoS-beveiliging op het niveau van het virtuele netwerk verdedigt zich tegen verkeersstromen die gericht zijn op internetgerichte toepassingen en onderhoudt de beschikbaarheid van services tijdens aanvallen.
Beveilig operationele toegang tot AI-workloads met Azure Bastion. Gebruik een jumpbox en Azure Bastion om operationele toegang tot AI-workloads te beveiligen en directe internetblootstelling van beheerinterfaces te voorkomen. Met deze aanpak maakt u een beveiligde gateway voor beheertaken, terwijl de netwerkisolatie voor AI-resources behouden blijft.
Kies de juiste connectiviteit voor on-premises gegevensbronnen. Organisaties die grote hoeveelheden gegevens van on-premises bronnen overdragen naar cloudomgevingen, hebben verbindingen met hoge bandbreedte nodig om de prestatievereisten van AI-workloads te ondersteunen.
Gebruik Azure ExpressRoute voor gegevensoverdracht met een groot volume.Azure ExpressRoute biedt toegewezen connectiviteit voor grote gegevensvolumes, realtime verwerking of workloads die consistente prestaties vereisen. ExpressRoute bevat een FastPath-functie waarmee de prestaties van het gegevenspad worden verbeterd door de ExpressRoute-gateway voor specifieke verkeersstromen te omzeilen.
Gebruik Azure VPN Gateway voor gemiddelde gegevensoverdracht.Azure VPN Gateway werkt goed voor gemiddelde gegevensvolumes, onregelmatige gegevensoverdracht of wanneer openbare internettoegang is vereist. VPN Gateway biedt een eenvoudigere installatie en kosteneffectieve bewerking voor kleinere gegevenssets in vergelijking met ExpressRoute. Gebruik de juiste topologie en ontwerp voor uw AI-workloads, inclusief site-naar-site-VPN voor cross-premises connectiviteit en punt-naar-site-VPN voor beveiligde apparaattoegang.
AI-betrouwbaarheid tussen regio's vaststellen
AI-betrouwbaarheid vereist strategische regioplaatsing en redundantieplanning om consistente prestaties en hoge beschikbaarheid te garanderen. Organisaties moeten het hosten van modellen, locatie van gegevens en herstel na noodgevallen aanpakken om betrouwbare AI-services te onderhouden. U moet uw regionale implementatiestrategie plannen om serviceonderbrekingen te voorkomen en de prestaties te optimaliseren. U doet dit als volgt:
AI-eindpunten implementeren in meerdere regio's voor productieworkloads. Voor PRODUCTIE-AI-workloads is hosting in ten minste twee regio's vereist om redundantie te bieden en hoge beschikbaarheid te garanderen. Implementaties in meerdere regio's maken snellere failover en herstel mogelijk tijdens regionale storingen. Gebruik voor Azure OpenAI in Azure AI Foundry globale implementaties die aanvragen automatisch routeren naar regio's met beschikbare capaciteit. Voor regionale implementaties implementeert u Azure API Management om API-aanvragen te verdelen over AI-eindpunten.
Controleer de beschikbaarheid van AI-services in doelregio's vóór de implementatie. Verschillende regio's bieden verschillende niveaus van beschikbaarheid van AI-services en functieondersteuning. Controleer de beschikbaarheid van Azure-services per regio om te controleren of uw vereiste AI-services beschikbaar zijn. Azure OpenAI-implementatiemodellen omvatten globale standaard, globaal ingericht, regionale standaard en regionale ingerichte opties met verschillende regionale beschikbaarheidspatronen.
Evalueer regionale quotumlimieten en capaciteitsvereisten. Azure AI-services hebben regionale abonnementslimieten die van invloed zijn op grootschalige modelimplementaties en deductieworkloads. Neem proactief contact op met de ondersteuning van Azure wanneer u verwacht dat capaciteitsbehoeften hoger zijn dan de standaardquota om serviceonderbrekingen tijdens het schalen te voorkomen.
Optimaliseer de plaatsing van gegevens voor generatie-applicaties die door opvraging worden uitgebreid. Locatie voor gegevensopslag is aanzienlijk van invloed op de prestaties van toepassingen in RAG-scenario's. Door gegevens samen te zoeken met AI-modellen in dezelfde regio vermindert u de latentie en verbetert u de efficiëntie van het ophalen van gegevens, hoewel configuraties in meerdere regio's haalbaar blijven voor specifieke bedrijfsvereisten.
Repliceer kritieke AI-assets naar secundaire regio's voor bedrijfscontinuïteit. Voor bedrijfscontinuïteit moeten nauwkeurig afgestemde modellen, RAG-gegevenssets, getrainde modellen en trainingsgegevens worden gerepliceerd naar secundaire regio's. Assetreplicatie maakt sneller herstel mogelijk tijdens storingen en onderhoudt de beschikbaarheid van services in verschillende foutscenario's.
Een AI-basis tot stand brengen
Een AI-basis biedt de kerninfrastructuur en resourcehiërarchie die AI-workloads in Azure ondersteunen. Het omvat het instellen van schaalbare, veilige omgevingen die zijn afgestemd op governance- en operationele behoeften. Een sterke AI-basis maakt efficiënte implementatie en beheer van AI-workloads mogelijk. Het zorgt ook voor beveiliging en flexibiliteit voor toekomstige groei.
Een Azure-landingszone gebruiken
Een Azure-landingszone is het aanbevolen startpunt waarmee uw Azure-omgeving wordt voorbereid. Het biedt een vooraf gedefinieerde installatie voor platform- en toepassingsbronnen. Zodra het platform is geïmplementeerd, kunt u AI-workloads implementeren in toegewezen landingszones voor toepassingen.
Als uw organisatie Azure-landingszones gebruikt voor workloads, kunt u deze blijven gebruiken voor workloads die GEBRUIKMAKEN van AI. U implementeert uw AI-workloads in toegewezen landingszones voor toepassingen. In afbeelding 2 hieronder ziet u hoe AI-workloads worden geïntegreerd binnen een Azure-landingszone.
Afbeelding 2. AI-workload in een Azure-landingszone.
Een AI-omgeving bouwen
Als u geen Azure-landingszone gebruikt, volgt u de aanbevelingen in dit artikel om uw AI-omgeving te bouwen. In het volgende diagram ziet u een basislijnresourcehiërarchie. Hiermee worden interne AI-workloads en op het internet gerichte AI-workloads gesegmenteerd. Interne workloads gebruiken beleid om onlinetoegang van klanten te weigeren. Met deze scheiding worden interne gegevens beschermd tegen blootstelling aan externe gebruikers. AI-ontwikkeling moet een jumpbox gebruiken om AI-resources en -gegevens te beheren.
Afbeelding 3. Basislijnresourcehiërarchie voor AI-workloads.
Volgende stappen
De volgende stap is het bouwen en implementeren van AI-workloads in uw AI-omgeving. Gebruik de volgende koppelingen om de architectuurrichtlijnen te vinden die aan uw behoeften voldoen. Begin met PaaS-architecturen (Platform-as-a-Service). PaaS is de aanbevolen benadering van Microsoft om AI te gebruiken.