Affärskontinuitet och haveriberedskap

Katastrofer kan vara maskinvarufel, naturkatastrofer eller programvarufel. Processen för att förbereda för och återställa från en katastrof kallas haveriberedskap (DR). I den här artikeln beskrivs rekommenderade metoder för att uppnå affärskontinuitet och haveriberedskap (BCDR) för Azure Operator Insights.

BCDR-strategier omfattar redundans i tillgänglighetszoner och användarhanterad återställning.

Kontrollplan

Azure Operator Insights-kontrollplanet är motståndskraftigt både mot programvarufel och fel i en tillgänglighetszon. Möjligheten att skapa och hantera dataprodukter påverkas inte av dessa fellägen.

Kontrollplanet är inte regionalt redundant. Under ett avbrott i en Azure-region kan du inte skapa nya dataprodukter i den regionen eller komma åt/hantera befintliga. När regionen har återställts från avbrottet kan du komma åt och hantera befintliga dataprodukter igen.

Dataplanet

Dataprodukter är motståndskraftiga mot programvaru- eller maskinvarufel. Om ett programfel till exempel gör att tjänsten kraschar, eller om ett maskinvarufel gör att beräkningsresurserna för berikningsfrågor går förlorade, återställs tjänsten automatiskt. Den enda effekten är en liten fördröjning i att nyligen inmatade data blir tillgängliga i dataproduktens lagringsslutpunkt och i KQL-förbruknings-URL:en.

Zonredundans

Dataprodukter stöder inte zonredundans. När en tillgänglighetszon misslyckas är dataproduktens inmatning, blob/DFS och KQL/SQL-API:er alla otillgängliga och instrumentpanelerna fungerar inte. Omvandlingen av redan inmatade data pausas. Inga tidigare inmatade data går förlorade. Bearbetningen återupptas när tillgänglighetszonen återställs.

Vad som händer med data som genererades under avbrott i tillgänglighetszonen beror på beteendet för inmatningsagenten:

  • Om inmatningsagenten buffrar data och skickar dem igen när tillgänglighetszonen återställs går data inte förlorade. Azure Operator Insights kan ta lite tid att gå igenom sina kvarvarande uppgifter om transformering.
  • Annars går data förlorade.

Haveriberedskap

Azure Operator Insights har ingen medfödd regionredundans. Regionala avbrott påverkar dataprodukter på samma sätt som fel i tillgänglighetszonen. Vi har rekommendationer och funktioner för att stödja kunder som vill kunna hantera fel i en hel Azure-region.

Användarhanterad redundans

För maximal redundans kan du distribuera dataprodukter i aktivt-aktivt läge. Distribuera en andra dataprodukt i en Azure-säkerhetskopieringsregion som du väljer och konfigurera dina inmatningsagenter för att förgrena data till båda dataprodukterna samtidigt. Säkerhetskopieringsdataprodukten påverkas inte av felet i den primära regionen. Under ett regionalt avbrott tittar du på instrumentpaneler som använder säkerhetskopieringsdataprodukten som datakälla. Den här arkitekturen fördubblar kostnaden för lösningen.

Du kan också använda ett aktivt-passivt läge. Distribuera en andra dataprodukt i en Azure-säkerhetskopieringsregion och konfigurera dina inmatningsagenter att skicka till den primära dataprodukten. Under ett regionalt avbrott konfigurerar du om dina inmatningsagenter för att skicka data till säkerhetskopieringsdataprodukten under ett regionstopp. Den här arkitekturen ger fullständig åtkomst till data som skapats under driftstoppet (från och med den tidpunkt då du konfigurerar om inmatningsagenterna), men under driftstoppet har du inte åtkomst till data som matas in före den tiden. Den här arkitekturen kräver en liten infrastrukturavgift för den andra dataprodukten, men inga ytterligare databehandlingsavgifter.