gebeurtenis
17 mrt, 21 - 21 mrt, 10
Neem deel aan de meetup-serie om schaalbare AI-oplossingen te bouwen op basis van praktijkgebruiksvoorbeelden met collega-ontwikkelaars en experts.
Nu registrerenDeze browser wordt niet meer ondersteund.
Upgrade naar Microsoft Edge om te profiteren van de nieuwste functies, beveiligingsupdates en technische ondersteuning.
Azure OpenAI is beschikbaar in meerdere regio's. Wanneer u een Azure OpenAI-resource maakt, geeft u een regio op. Vanaf dat jaar blijven uw resource en alle bijbehorende bewerkingen gekoppeld aan die Azure-serverregio.
Het is zeldzaam, maar niet onmogelijk, om een netwerkprobleem te krijgen dat een hele regio raakt. Als uw service altijd beschikbaar moet zijn, moet u deze ontwerpen voor failover in een andere regio of de workload splitsen tussen twee of meer regio's. Voor beide benaderingen zijn ten minste twee Azure OpenAI-resources in verschillende regio's vereist. Dit artikel bevat algemene aanbevelingen voor het implementeren van BCDR (Business Continuity and Disaster Recovery) voor uw Azure OpenAI-toepassingen.
De Azure OpenAI-service biedt standaard een standaard-SLA. Hoewel de standaardtolerantie voldoende kan zijn voor veel toepassingen, moeten toepassingen die hoge mate van tolerantie en bedrijfscontinuïteit vereisen, extra stappen uitvoeren om hun modelinfrastructuur verder te versterken.
Notitie
Als u Global Standard-implementaties kunt gebruiken, moet u deze in plaats daarvan gebruiken. Implementaties van gegevenszones zijn de beste optie voor organisaties die gegevensverwerking volledig binnen een geografische grens vereisen.
Voor standaardimplementaties wordt standaard de implementatie van de gegevenszone (VS/EU-opties) gebruikt.
U moet twee Azure OpenAI Service-resources implementeren in het Azure-abonnement. De ene resource moet worden geïmplementeerd in uw voorkeursregio en de andere resource moet worden geïmplementeerd in uw secundaire/failoverregio. De Azure OpenAI-service wijst quota toe op abonnements- en regioniveau, zodat ze in hetzelfde abonnement kunnen wonen zonder dat dit van invloed is op het quotum.
U moet één implementatie hebben voor elk model dat u wilt gebruiken voor de Azure OpenAI-serviceresource in uw favoriete Azure-regio. U moet deze modelimplementaties dupliceren in de secundaire/failoverregio. Wijs het volledige quotum toe dat beschikbaar is in uw standaardimplementatie aan elk van deze eindpunten. Dit biedt de hoogste doorvoersnelheid in vergelijking met het splitsen van quotum voor meerdere implementaties.
Selecteer de implementatieregio op basis van uw netwerktopologie. U kunt een Azure OpenAI-serviceresource implementeren in elke ondersteunde regio en vervolgens een privé-eindpunt maken voor die resource in uw voorkeursregio.
Als er sprake is van een regionale storing waarbij de implementatie een onbruikbare status heeft, kunt u de andere implementatie in de secundaire/passieve regio binnen hetzelfde abonnement gebruiken.
Het extra voordeel van deze architectuur is dat u standaardimplementaties kunt stapelen met ingerichte implementaties, zodat u kunt inbellen bij het gewenste prestatie- en tolerantieniveau. Hierdoor kunt u PTU gebruiken voor uw basislijnvraag voor workloads en gebruikmaken van betalen per gebruik voor pieken in het verkeer.
De infrastructuur die ondersteuning biedt voor de Azure OpenAI-architectuur, moet worden overwogen in ontwerpen. De infrastructuuronderdelen die betrokken zijn bij de architectuur variëren, afhankelijk van of de toepassingen de Azure OpenAI-service via internet of via een particulier netwerk gebruiken. In de architectuur die in dit artikel wordt besproken, wordt ervan uitgegaan dat de organisatie een Generatieve AI-gateway heeft geïmplementeerd. Organisaties met een volwassen Azure-footprint en hybride connectiviteit moeten de service gebruiken via een privénetwerk, terwijl organisaties zonder hybride connectiviteit, of met toepassingen in een andere cloud, zoals GCP of AWS, de service gebruiken via de openbare backbone van Microsoft.
Organisaties die de service gebruiken via de openbare backbone van Microsoft, moeten rekening houden met de volgende ontwerpelementen:
De Generatieve AI-gateway moet worden geïmplementeerd op een manier die ervoor zorgt dat deze beschikbaar is in het geval van een regionale storing in Azure. Als u APIM (Azure API Management) gebruikt, kunt u dit doen door afzonderlijke APIM-exemplaren in meerdere regio's te implementeren of door de functie gateway voor meerdere regio's van APIM te gebruiken.
Een openbare globale server load balancer moet worden gebruikt om taken te verdelen over de meerdere Generatieve AI Gateway-exemplaren op een actieve/actieve of actieve/passieve manier. Azure FrontDoor kan worden gebruikt om aan deze rol te voldoen, afhankelijk van de vereisten van de organisatie.
Organisaties die de service via een particulier netwerk gebruiken, moeten rekening houden met de volgende ontwerpelementen:
gebeurtenis
17 mrt, 21 - 21 mrt, 10
Neem deel aan de meetup-serie om schaalbare AI-oplossingen te bouwen op basis van praktijkgebruiksvoorbeelden met collega-ontwikkelaars en experts.
Nu registrerenTraining
Module
Business continuity and disaster recovery for Azure Virtual Desktop - Training
Microsoft Azure Virtual Desktop is a cloud service that helps you give users a secure remote desktop that they can use anywhere. With Azure Virtual Desktop, you can plan appropriate business continuity and disaster recovery (BCDR) strategies to help protect against both unplanned and planned failures and to provide redundancy.
Certificering
Microsoft-gecertificeerd: Azure AI Ingenieur Medewerker (Associate) - Certifications
Ontwerp en implementeer een Azure AI-oplossing met behulp van Azure AI-services, Azure AI Search en Azure Open AI.