Resiliência de interrupção da zona de disponibilidade no Azure Cosmos DB para PostgreSQL

APLICA-SE A: Azure Cosmos DB para PostgreSQL (alimentado pela extensão de banco de dados Citus para PostgreSQL)

Muitas regiões do Azure têm zonas de disponibilidade. As zonas de disponibilidade (AZs) são grupos separados de datacenters dentro de uma região. As zonas de disponibilidade são próximas o suficiente para ter conexões de baixa latência com outras zonas de disponibilidade dentro de sua região. Eles são conectados por uma rede de alto desempenho com uma latência de ida e volta de menos de 2 milissegundos.

Ao mesmo tempo, as zonas de disponibilidade estão suficientemente afastadas para reduzir a probabilidade de mais de uma ser afetada por interrupções locais ou pelo clima. As zonas de disponibilidade têm infraestruturas independentes de energia, refrigeração e rede. Eles são projetados para que, se uma zona sofrer uma interrupção, os serviços regionais sejam suportados pelas zonas restantes em vários serviços do Azure.

O Azure Cosmos DB para PostgreSQL dá suporte a zonas de disponibilidade para maior confiabilidade e recuperação de desastres. As vantagens das zonas de disponibilidade variam dependendo se a alta disponibilidade está habilitada em um cluster do Azure Cosmos DB para PostgreSQL.

Resiliência de interrupção da zona de disponibilidade para componentes de serviço regional

Há muitos componentes de serviço do Azure Cosmos DB para PostgreSQL em cada região do Azure com suporte que não pertencem a clusters individuais, mas são partes críticas da execução do serviço gerenciado. Esses componentes permitem a execução contínua de todas as operações de gerenciamento, como o provisionamento e o dimensionamento de novos clusters existentes, e todas as operações internas, como o monitoramento da integridade do nó.

Quando a região do Azure dá suporte a zonas de disponibilidade, todos esses componentes de serviço são configurados para serem redundantes AZ. Isso significa que todos os componentes de serviço do Azure Cosmos DB para PostgreSQL podem sustentar a interrupção de uma AZ ou, em outras palavras, são resilientes a uma única interrupção de AZ.

Quer um cluster esteja configurado com alta disponibilidade ou não, suas operações contínuas dependem desses componentes de serviço. A redundância AZ dos componentes de serviço é um elemento crítico da resiliência de interrupção da zona de disponibilidade no Azure Cosmos DB para PostgreSQL.

Impacto da interrupção da zona de disponibilidade em clusters com e sem alta disponibilidade

Todos os nós em um cluster são provisionados em uma zona de disponibilidade. A configuração AZ preferida permite colocar todos os nós do cluster na mesma zona de disponibilidade em que o aplicativo é implantado. Ter todos os nós na mesma AZ garante menor latência entre os nós, melhorando assim o desempenho geral do cluster.

Quando a alta disponibilidade (HA) é habilitada em um cluster, todos os nós primários são criados em uma AZ e todos os nós em espera são provisionados em outra AZ. Os nós podem mover-se entre zonas de disponibilidade durante os seguintes eventos:

  • Ocorre uma falha em um nó primário habilitado para HA. Neste caso, o modo de espera do nó primário se tornará um novo AZ primário e o AZ do nó em espera será o novo AZ desse nó primário.
  • Um evento de manutenção agendada acontece no cluster. No final da manutenção, todos os nós primários em um cluster estarão no mesmo AZ.

Se a alta disponibilidade estiver habilitada, o cluster continuará disponível durante a interrupção da AZ, com um possível failover nos nós primários que estão na AZ afetada. Se a alta disponibilidade não estiver habilitada em um cluster, somente a interrupção na AZ onde os nós são implantados afetará a disponibilidade do cluster.

Você sempre pode verificar a zona de disponibilidade para cada nó primário usando o portal do Azure ou usando métodos programáticos, como APIs REST.

Para obter os benefícios de resiliência das zonas de disponibilidade, seu cluster precisa estar em uma das regiões do Azure onde o Azure Cosmos DB para PostgreSQL está configurado para resiliência de interrupção AZ.

Próximos passos