Delen via


Betrouwbaarheid in Microsoft Community Training

Microsoft Community Training is een cloudoplossing op basis van Azure die grootschalige, verre verspreide trainingsprogramma's met hoge kwaliteit en efficiëntie kan leveren. Met Community Training kunnen organisaties van alle grootten en typen grootschalige trainingsprogramma's uitvoeren voor hun interne en externe community's. Gemeenschappen kunnen bestaan uit frontlinewerkers, een uitgebreid personeelsbestand, een partnerecosysteem, een vrijwilligersnetwerk en programma-begunstigden.

In dit artikel wordt betrouwbaarheidsondersteuning in Community Training beschreven en wordt zowel regionale tolerantie behandeld als beschikbaarheidszones en herstel na noodgevallen en bedrijfscontinuïteit. Zie Azure-betrouwbaarheid voor een gedetailleerder overzicht van een betrouwbaarheidsprincipe in Azure.

Ondersteuning voor beschikbaarheidszone

Beschikbaarheidszones zijn fysiek afzonderlijke groepen datacenters binnen elke Azure-regio. Wanneer één zone uitvalt, kunnen services een failover uitvoeren naar een van de resterende zones.

Zie Wat zijn beschikbaarheidszones in Azure voor meer informatie over beschikbaarheidszones?

CommunityTraining maakt gebruik van Azure-beschikbaarheidszones om hoge beschikbaarheid en fouttolerantie binnen een Azure-regio te bieden. Communitytraining biedt ondersteuning voor de beschikbaarheidszone voor besturings- en gegevensvlakken:

  • Het besturingsvlak is zone-redundant in de primaire regio's van beschikbaarheid.

  • Het gegevensvlak kan zonegebonden of zone-redundant zijn, afhankelijk van uw keuze. Het wordt echter ten zeerste aanbevolen om een zone-redundante implementatie te kiezen om gegevensverlies te voorkomen en servicebeschikbaarheid te behouden tijdens een zonestoring.

Vereisten

  • Beschikbaarheidszones worden ondersteund voor de volgende communitytrainings-SKU's:

    • Standaard (lagere schaal van gebruikers)
    • Premium (grote schaal van gebruikers)
  • Communitytraining wordt alleen ondersteund in gekoppelde regio's. Elke secundaire regio wordt geïmplementeerd met een zonegebonden configuratie. In de volgende tabel ziet u alle regio's die ondersteuning bieden voor beschikbaarheidszones voor Community Training, samen met hun gekoppelde regio.

Primaire regio Gekoppelde regio
UKSouth UKWest
AustraliaEast Zuidoost-Australië
Oost-VS Westelijke Verenigde Staten
EastUS2 CentralUS
Noord-Europa West-Europa
WestUS3 Oost-VS
SwedenCentral Zuid-Zweden

Ondersteuning voor zonale failover

CommunityTraining maakt gebruik van veel afhankelijkheidsservices van Azure, zoals App Service en Azure SQL. Wanneer u een zoneredundante implementatie kiest, maakt Community Training ook zonegebonden redundante aanbiedingen van die onderliggende Azure-servicebronnen. Als één zone mislukt, worden alle resources, inclusief afhankelijkheden, overgezet naar een van de zones die in orde zijn.

Een resource maken waarvoor beschikbaarheidszone is ingeschakeld

CommunityTraining biedt alleen configuratie voor beschikbaarheidszones op het moment dat het exemplaar wordt gemaakt. Als u de configuratie van de beschikbaarheidszone wilt wijzigen nadat de instantie is gemaakt, moet u een nieuwe instantie maken.

Ontspannende ervaring

  • Zonaal. Tijdens een zonebrede storing kan communitytraining een volledige of gedeeltelijke serviceonderbreking hebben. De mate waarin het beschikbaar is, is afhankelijk van verschillende factoren, zoals of het hele datacenter niet beschikbaar is of of een specifieke afhankelijkheidsservice niet meer beschikbaar is in die zone.

  • Zone redundant. Tijdens een zonebrede storing zou u geen invloed moeten ondervinden op de ingerichte resources. U moet echter voorbereid zijn op een korte onderbreking van de communicatie met deze resources. Bij een zone-uitval ontvangen clients meestal 409 foutcodes, terwijl pogingen worden ondernomen om logischerwijs verbindingen opnieuw tot stand te brengen op geschikte intervallen. Nieuwe aanvragen worden gericht naar gezonde knooppunten zonder impact op de gebruiker. Tijdens storingen in de hele zone kunnen gebruikers nieuwe resources maken en bestaande resources schalen.

Herstel na noodgevallen en bedrijfscontinuïteit

Herstel na noodgevallen (DR) verwijst naar procedures die organisaties gebruiken om te herstellen van gebeurtenissen met hoge impact, zoals natuurrampen of mislukte implementaties die leiden tot downtime en gegevensverlies. Ongeacht de oorzaak is de beste oplossing voor een noodgeval een goed gedefinieerd en getest DR-plan en een toepassingsontwerp dat actief dr ondersteunt. Zie Aanbevelingen voor het ontwerpen van een strategie voor herstel na noodgevallenvoordat u begint met het maken van uw plan voor herstel na noodgevallen.

Voor DR maakt Microsoft gebruik van het model voor gedeelde verantwoordelijkheid. In dit model zorgt Microsoft ervoor dat de basisinfrastructuur en platformservices beschikbaar zijn. Veel Azure-services repliceren echter niet automatisch gegevens of vallen terug van een mislukte regio om kruislings te repliceren naar een andere ingeschakelde regio. Voor deze services bent u verantwoordelijk voor het instellen van een plan voor herstel na noodgevallen dat geschikt is voor uw workload. De meeste services die worden uitgevoerd op PaaS-aanbiedingen (Platform as a Service) van Azure bieden functies en richtlijnen voor ondersteuning van disaster recovery. U kunt servicespecifieke functies gebruiken om snelle herstelbewerkingen te ondersteunen en uw noodherstelplan te ontwikkelen.

Het Microsoft Community Training-team beheert de volledige procedure voor herstel na noodgevallen voor communitytraining. Herstel na noodgevallen is niet actief-actief of actief-passief, maar is in plaats daarvan gebaseerd op herstel vanuit de meest recente beschikbare back-up van Azure-diensten. Het communitytrainingsteam maakt handmatig alle resources in de gekoppelde regio op basis van gegevensback-up.

Notitie

Communitytraining voor herstel na noodgevallen wordt alleen ondersteund in gekoppelde regio's.

Herstel na noodgevallen in geografie in meerdere regio's

  • Bij een regionale ramp wordt het besturingsvlak handmatig overgeschakeld naar de gekoppelde regio. U zou een aantal serviceverminderingen in de tijd moeten verwachten voordat de failover is voltooid. Na de failover worden alleen-lezen bewerkingen ondersteund totdat het rampgebied weer online is. De service wordt handmatig teruggezet naar de oorspronkelijke regio zodra deze weer online is, waarna alle bewerkingen worden hervat. RPO (Recovery Point Objective) is naar verwachting 10 minuten; Beoogde hersteltijd (RTO), 24 uur.

  • Voor het gegevensniveau biedt Community Training door Microsoft beheerde herstel na een noodgeval aan. Om beheerd noodherstel te gebruiken, moet u noodherstel inschakelen tijdens het maken van een communitytrainingsexemplaar in Azure. Zodra u herstel na noodgevallen hebt ingeschakeld, onderhoudt Microsoft de back-up van opslag en database in de gekoppelde regio. RPO (Recovery Point Objective) is naar verwachting 12 uur; Beoogde hersteltijd (RTO), 48 uur.

Notitie

RTO is afhankelijk van de database en de opslaggrootte en de latentie tussen de gekoppelde regio's. Database- of opslag-VM-capaciteit (SKU). RPO is afhankelijk van onderliggende Azure-resources, zoals Azure SQL en Azure Storage. Zie Wat zijn bedrijfscontinuïteit, hoge beschikbaarheid en herstel na noodgevallen voor meer informatie over RTO en RPO.

Detectie, melding en beheer van storingen

Wanneer er een Community Training gezondheidscontrole een storing van een dienst detecteert, in om het even welke regio, vraagt Microsoft uw toestemming voor failover naar de gekoppelde regio. Microsoft informeert u welke functies beschikbaar zijn tijdens de procedure voor herstel na noodgevallen. Zodra Microsoft uw toestemming heeft ontvangen, kan het communitytrainingsteam vervolgens de procedure voor herstel na noodgevallen starten.

Belangrijk

Cursisten kunnen geen audio-/videofuncties gebruiken totdat de primaire regio operationeel is. Het is raadzaam om het uploaden van media te vermijden totdat de primaire site operationeel is.

Capaciteit en proactieve veerkracht voor herstel bij noodgevallen

Microsoft en haar klanten werken onder het model voor gedeelde verantwoordelijkheid. Zodra een regio uitvalt, wordt niet alleen het communitytrainingsexemplaar gemigreerd naar de gekoppelde regio, maar worden ook alle workloads van producten en klanten gemigreerd naar de gekoppelde regio. Deze procedure kan leiden tot een tekort aan resources in de gekoppelde regio of het gekoppelde datacenter. Als gevolg hiervan is de beschikbaarheid van herstel na noodgevallen afhankelijk van de beschikbare capaciteit van de onderliggende Azure-resources.

Volgende stappen