Betrouwbaarheid in communitytraining

Artikel
12/12/2023

CommunityTraining is een cloudoplossing op basis van Azure die grootschalige, verre verspreide trainingsprogramma's met hoge kwaliteit en efficiëntie kan leveren. Met Community Training kunnen organisaties van alle grootten en typen grootschalige trainingsprogramma's uitvoeren voor hun interne en externe community's. Community's kunnen frontlinewerkers, uitgebreide werknemers, een partnerecosysteem, een vrijwilligersnetwerk en programma-begunstigden zijn.

In dit artikel wordt betrouwbaarheidsondersteuning in Community Training beschreven en wordt zowel regionale tolerantie behandeld als beschikbaarheidszones en herstel na noodgevallen en bedrijfscontinuïteit. Zie Azure-betrouwbaarheid voor een gedetailleerder overzicht van een betrouwbaarheidsprincipe in Azure.

Ondersteuning voor beschikbaarheidszone

Azure-beschikbaarheidszones zijn ten minste drie fysiek afzonderlijke groepen datacenters binnen elke Azure-regio. Datacenters binnen elke zone zijn uitgerust met onafhankelijke energie-, koelings- en netwerkinfrastructuur. In het geval van een storing in een lokale zone worden beschikbaarheidszones zodanig ontworpen dat als de ene zone wordt beïnvloed, regionale services, capaciteit en hoge beschikbaarheid worden ondersteund door de resterende twee zones.

Fouten kunnen variëren van software- en hardwarefouten tot gebeurtenissen zoals aardbevingen, overstromingen en brand. Tolerantie voor fouten wordt bereikt met redundantie en logische isolatie van Azure-services. Zie Regio's en beschikbaarheidszones voor meer informatie over beschikbaarheidszones in Azure.

Services met azure-beschikbaarheidszones zijn ontworpen om het juiste niveau van betrouwbaarheid en flexibiliteit te bieden. Ze kunnen op twee manieren worden geconfigureerd. Ze kunnen zone-redundant zijn, met automatische replicatie tussen zones of zonegebonden, waarbij exemplaren zijn vastgemaakt aan een specifieke zone. U kunt deze benaderingen ook combineren. Zie Aanbevelingen voor meer informatie over zone-redundante versus zone-redundante architectuur voor het gebruik van beschikbaarheidszones en regio's.

CommunityTraining maakt gebruik van Azure-beschikbaarheidszones om hoge beschikbaarheid en fouttolerantie binnen een Azure-regio te bieden. Communitytraining biedt ondersteuning voor de beschikbaarheidszone voor besturings- en gegevensvlakken:

Het besturingsvlak is zoneredundant in de primaire beschikbaarheidsregio's.
Het gegevensvlak kan zone-redundant of zone-redundant zijn, afhankelijk van wat u voor uw behoeften kiest. Het wordt echter ten zeerste aanbevolen om een zone-redundante implementatie te kiezen om gegevensverlies te voorkomen en servicebeschikbaarheid te behouden tijdens een zonestoring.

Vereisten

Beschikbaarheidszones worden ondersteund voor de volgende communitytrainings-SKU's:
- Standaard (lagere schaal van gebruikers)
- Premium (grote schaal van gebruikers)
Communitytraining wordt alleen ondersteund in gekoppelde regio's. Elke secundaire regio wordt geïmplementeerd met een zonegebonden configuratie. In de volgende tabel ziet u alle regio's die ondersteuning bieden voor beschikbaarheidszones voor Community Training, samen met hun gekoppelde regio.

Primaire regio	Gekoppelde regio
UKSouth	UKWest
AustraliaEast	AustraliaSoutheast
EastUS	WestUS
EastUS2	CentralUS
Noord-Europa	West-Europa
WestUS3	EastUS
SwedenCentral	SwedenSouth

Ondersteuning voor zonegebonden failover

CommunityTraining maakt gebruik van veel afhankelijkheidsservices van Azure, zoals App Service en Azure SQL. Wanneer u een zoneredundante implementatie kiest, maakt Community Training ook zonegebonden redundante aanbiedingen van die onderliggende Azure-servicebronnen. Als één zone mislukt, worden alle resources, inclusief afhankelijkheidsbronnen, een failover uitgevoerd naar een van de zones die in orde zijn.

Een resource maken waarvoor beschikbaarheidszone is ingeschakeld

CommunityTraining biedt alleen configuratie voor beschikbaarheidszones op het moment dat het exemplaar wordt gemaakt. Als u de configuratie van de beschikbaarheidszone wilt wijzigen nadat het exemplaar is gemaakt, moet u een nieuw exemplaar maken. Zie CommunityTraining maken voor meer informatie over het maken van uw communitytrainingsexemplaren.

Zone-down-ervaring

Zonegebonden. Tijdens een zonebrede storing kan communitytraining een volledige of gedeeltelijke serviceonderbreking hebben. De mate waarin het beschikbaar is, is afhankelijk van verschillende factoren, zoals of het hele datacenter niet beschikbaar is of of een specifieke afhankelijkheidsservice niet meer beschikbaar is in die zone.
Zone-redundant. Tijdens een zonebrede storing moet u geen invloed hebben op ingerichte resources. U moet echter voorbereid zijn op een korte onderbreking van de communicatie met deze resources. In een zone-down situatie ontvangen clients meestal 409 foutcodes, evenals pogingen om opnieuw pogingen te doen om verbindingen opnieuw tot stand te brengen met de juiste intervallen. Nieuwe aanvragen worden omgeleid naar knooppunten met een goede invloed op de gebruiker. Tijdens storingen in de hele zone kunnen gebruikers nieuwe resources maken en bestaande resources schalen.

Herstel na noodgevallen en bedrijfscontinuïteit

Herstel na noodgevallen (DR) gaat over het herstellen van gebeurtenissen met een hoge impact, zoals natuurrampen of mislukte implementaties die downtime en gegevensverlies tot gevolg hebben. Ongeacht de oorzaak is de beste oplossing voor een noodgeval een goed gedefinieerd en getest DR-plan en een toepassingsontwerp dat actief dr ondersteunt. Zie Aanbevelingen voordat u nadenkt over het maken van uw plan voor herstel na noodgevallen.

Als het gaat om herstel na noodgevallen, gebruikt Microsoft het model voor gedeelde verantwoordelijkheid. In een model voor gedeelde verantwoordelijkheid zorgt Microsoft ervoor dat de basisinfrastructuur en platformservices beschikbaar zijn. Tegelijkertijd repliceren veel Azure-services niet automatisch gegevens of vallen ze terug van een mislukte regio om kruislings te repliceren naar een andere ingeschakelde regio. Voor deze services bent u verantwoordelijk voor het instellen van een plan voor herstel na noodgevallen dat geschikt is voor uw workload. De meeste services die worden uitgevoerd op PaaS-aanbiedingen (Platform as a Service) van Azure bieden functies en richtlijnen ter ondersteuning van herstel na noodgeval en u kunt servicespecifieke functies gebruiken om snel herstel te ondersteunen om uw DR-plan te ontwikkelen.

Het Microsoft Community Training-team beheert de volledige procedure voor herstel na noodgevallen voor communitytraining. Herstel na noodgevallen is niet actief-actief of actief, maar is in plaats daarvan gebaseerd op herstel vanuit de meest recente beschikbare back-up van Azure-services. Het communitytrainingsteam maakt handmatig alle resources in de gekoppelde regio op basis van gegevensback-up.

Notitie

Herstel na noodgevallen voor communitytraining wordt alleen ondersteund in gekoppelde regio's.

Herstel na noodgevallen in geografie in meerdere regio's

Bij een regionale ramp wordt het besturingsvlak handmatig overgeschakeld naar de gekoppelde regio. U zou een aantal serviceverminderingen in de tijd moeten verwachten voordat de failover is voltooid. Na de failover worden alleen-lezenbewerkingen ondersteund totdat de noodgevalregio weer online is. De service wordt handmatig teruggezet naar de oorspronkelijke regio zodra deze weer online is en alle bewerkingen worden hervat. RPO (Recovery Point Objective) is naar verwachting 10 minuten; Beoogde hersteltijd (RTO), 24 uur.
Voor het gegevensvlak biedt Community Training microsoft managed disaster recovery. Als u beheerd herstel na noodgevallen wilt gebruiken, moet u herstel na noodgevallen inschakelen tijdens het maken van een communitytrainingsexemplaren in Azure. Zodra u herstel na noodgevallen hebt ingeschakeld, onderhoudt Microsoft de back-up van opslag en database in de gekoppelde regio. RPO (Recovery Point Objective) is naar verwachting 12 uur; Beoogde hersteltijd (RTO), 48 uur.

Notitie

RTO is afhankelijk van de database en de opslaggrootte, latentie tussen de gekoppelde regio. Database- of opslag-VM-capaciteit (SKU). RPO is afhankelijk van onderliggende Azure-resources, zoals Azure SQL en Azure Storage. Zie Overzicht van herstel na noodgevallen voor meer informatie over RTO en RPO.

Detectie, melding en beheer van storingen

Wanneer een communitytrainingsstatuscontrole een storing van een service detecteert en in elke regio, vraagt Microsoft uw toestemming voor failover naar de gekoppelde regio. Microsoft informeert u welke functies beschikbaar zijn tijdens de procedure voor herstel na noodgevallen. Zodra Microsoft uw toestemming heeft ontvangen, kan het communitytrainingsteam vervolgens de procedure voor herstel na noodgevallen starten.

Belangrijk

Cursisten kunnen geen audio-/videofuncties gebruiken totdat de primaire regio operationeel is. Het is raadzaam om bewerkingen voor het uploaden van media te voorkomen totdat de primaire site operationeel is.

Tolerantie voor capaciteit en proactief herstel na noodgevallen

Microsoft en haar klanten werken onder het model voor gedeelde verantwoordelijkheid. Zodra een regio uitvalt, is niet alleen het communitytrainingsexemplaren gemigreerd naar de gekoppelde regio, maar ook alle workloads van producten en klanten worden ook gemigreerd naar gekoppelde regio. Deze procedure kan leiden tot een tekort aan resources in de gekoppelde regio of het gekoppelde datacenter. Als gevolg hiervan is de beschikbaarheid van herstel na noodgevallen afhankelijk van de beschikbare capaciteit van de onderliggende Azure-resources.

Volgende stappen

Betrouwbaarheid in Azure

Delen via