Replicação geográfica (visualização pública)

2025-04-16

Há dois recursos que fornecem recuperação de desastres geográficos nos Hubs de Eventos do Azure.

Recuperação de desastres geográficos (DR de metadados), que apenas fornece replicação de metadados.
Geo-replicação (pré-visualização pública), que fornece replicação de tanto de metadados quanto dos dados.

Nota

A visualização do recurso de replicação geográfica está disponível apenas na camada dedicada.

Esses recursos não devem ser confundidos com Zonas de disponibilidade. Ambos os recursos de recuperação geográfica fornecem resiliência entre regiões do Azure, como Leste dos EUA e Oeste dos EUA. O suporte à Zona de Disponibilidade fornece resiliência dentro de uma região geográfica específica, como o Leste dos EUA. Para obter mais informações sobre zonas de disponibilidade, consulte Suporte à zona de disponibilidade de Hubs de eventos.

Importante

Esse recurso está atualmente em visualização pública e, como tal, não deve ser usado em cenários de produção.
As seguintes regiões são atualmente suportadas no pré-lançamento público.

Região	Região	Região
AustráliaCentral	AlemanhaNorte	NoruegaOeste
AustráliaCentral2	AlemanhaWestCentral	PolóniaCentral
AustráliaLeste	IsraelCentral	África do SulNorte
Sudeste da Austrália	ItáliaNorte	África do SulOeste
BrasilSudeste	JapãoLeste	Sudeste Asiático
CanadáCentral	JapãoOeste	Sul da Índia
CanadáLeste	JioIndiaCentral	EspanhaCentral
Índia Central	JioIndiaWest	SuéciaCentral
Região Central dos EUA	CoreiaCentral	Suíça Norte
CentralUSEUAP	CoreiaSul	SuíçaOeste
Ásia Oriental	MéxicoCentral	UAECentral
LesteUS2	Centro-Norte dos EUA	UAENorth
FrançaCentral	Norte da Europa	UKSouth
FrançaSul	Noruega Este	UKWest

Recuperação de desastres (DR) de metadados versus replicação geográfica de metadados e dados

O recurso de recuperação de desastres de metadados replica informações de configuração (ou metadados) de um namespace de um namespace primário para um namespace secundário. Ele suporta um failover único para a região secundária. Durante o failover iniciado pelo cliente, o nome do alias para o namespace é redirecionado para o namespace secundário e, em seguida, o emparelhamento é quebrado. Nenhum dado é replicado além das informações de configuração nem as atribuições de permissão são replicadas.

O recurso de replicação geográfica mais recente replica informações de configuração e todos os dados de um namespace primário para um ou mais namespaces secundários. Quando ocorre um *failover*, o secundário selecionado é promovido a primário e o primário anterior torna-se um secundário. Os usuários podem executar um failover de volta ao primário original quando desejado.

Você pode migrar da recuperação de desastres (DR) de metadados para a replicação geográfica, interrompendo o emparelhamento de DR de metadados e habilitando a replicação geográfica, conforme mencionado neste documento.

O restante deste artigo se concentra no recurso de replicação geográfica. Para obter detalhes sobre o recurso de DR de metadados, consulte Recuperação de desastres geográficos de Hubs de Eventos para metadados.

Os benefícios dos namespaces replicados geograficamente

Garantindo a continuidade de negócios e a recuperação de desastres

A replicação geográfica garante a recuperação de desastres e a continuidade de negócios para todos os dados de streaming em seu namespace. Ao replicar dados entre regiões, as organizações podem se proteger contra perda de dados e garantir que seus aplicativos permaneçam operacionais mesmo no caso de uma interrupção regional. Isso é particularmente crucial para aplicativos de missão crítica que exigem alta disponibilidade e tempo de inatividade mínimo.

Distribuição Global de Dados

A replicação geográfica pode ser usada para distribuir dados globalmente, permitindo que os aplicativos acessem dados da região mais próxima. Isso reduz a latência e melhora o desempenho de cargas de trabalho localizadas em diferentes partes do mundo.

Soberania e conformidade de dados

As organizações que operam em vários países/regiões geralmente precisam cumprir as leis de soberania de dados que exigem que os dados sejam armazenados dentro de limites geográficos específicos. A replicação geográfica permite que essas organizações repliquem dados para regiões que estão em conformidade com as regulamentações locais, garantindo que elas atendam aos requisitos legais e, ao mesmo tempo, mantenham uma plataforma de dados unificada.

Migração e upgrades

A replicação geográfica também pode ser usada para facilitar a migração de dados, a manutenção e as atualizações do sistema. As organizações podem migrar seu namespace proativamente de uma região primária para uma secundária para permitir qualquer manutenção e atualizações na região primária.

Georreplicação

A pré-visualização pública da funcionalidade de replicação geográfica é suportada para namespaces em clusters dedicados de escalonamento autoajustável de Hubs de Eventos. Você pode usar o recurso com namespaces novos ou existentes em clusters de autoatendimento dedicados. Os seguintes recursos não são suportados pela replicação geográfica:

Criptografia de chaves gerenciadas pelo cliente (CMK).
Identidade gerenciada para captura.
Pontos finais privados.
Suporte a mensagens grandes (atualmente em visualização pública).
Kafka Streams and Transactions (atualmente em pré-visualização pública).

Alguns dos principais aspetos da visualização pública da Replicação de Dados Geográficos são:

Modelo de replicação primária-secundária – A replicação geográfica é construída no modelo de replicação primária-secundária, onde em um determinado momento há apenas um namespace primário que atende produtores e consumidores de eventos.
Os Hubs de Eventos executam replicação byte-a-byte totalmente gerenciada de metadados, dados de eventos e deslocamento do consumidor entre secundários com os níveis de consistência configurados.
Nome de domínio totalmente qualificado (FQDN) de um namespace estável — O FQDN não precisa ser alterado quando se realiza a promoção.
Consistência de replicação - Há duas configurações de consistência de replicação, síncrona e assíncrona.
Promoção de um secundário para o novo primário gerida pelo utilizador.

Alterar um secundário para um novo primário pode ser feito de duas formas:

Planejado: uma promoção do secundário para o primário, onde o tráfego não é processado até que o novo primário alcance todos os dados mantidos pela instância primária anterior.
Forçado: como um failover onde o secundário se torna primário o mais rápido possível. O recurso de replicação geográfica replica todos os dados e metadados da região primária para as regiões secundárias selecionadas. O nome de domínio FQDN do namespace sempre aponta para a região primária.

Diagrama mostrando quando a região A é primária, B é secundária.

Quando você inicia uma promoção de um secundário, o FQDN aponta para a região selecionada para ser a nova primária. A antiga primária torna-se então secundária. Você pode promover o seu servidor secundário para ser o novo servidor principal por razões que não incluam um failover. Esses motivos podem incluir atualizações de aplicações, testes de contingência ou uma série de outras coisas. Nessas situações, é comum voltar atrás quando essas atividades são concluídas.

Diagrama mostrando que, ao B se tornar o primário, A passa a ser o novo secundário.

As regiões secundárias são adicionadas ou removidas a critério do cliente. Existem algumas limitações atuais que merecem ser notadas:

Não é possível suportar visualizações somente de leitura em regiões secundárias.
Não existe capacidade automática para promoção ou failover. Todas as promoções são iniciadas pelo cliente.
As regiões secundárias devem ser diferentes da região primária. Não é possível selecionar outro cluster dedicado na mesma região.
Apenas uma instância secundária é suportada para visualização pública.

Consistência da replicação

Há duas configurações de consistência de replicação, síncrona e assíncrona. É importante conhecer as diferenças entre as duas configurações, pois elas têm impacto em seus aplicativos e na consistência dos dados.

Replicação assíncrona

Com a replicação assíncrona habilitada, todas as mensagens são confirmadas no primário e, em seguida, enviadas para o secundário. Os usuários podem configurar uma quantidade aceitável de tempo de atraso que o secundário tem para recuperar. Quando o atraso de um secundário ativo é maior do que a configuração de atraso do usuário, a região primária limita as solicitações de publicação de entrada.

Replicação síncrona

Quando a replicação síncrona está habilitada, os eventos publicados são replicados para o secundário, que deve confirmar a mensagem antes que ela seja confirmada no principal. Com a replicação síncrona, seu aplicativo publica na taxa necessária para publicar, replicar, reconhecer e confirmar. Isso também significa que seu aplicativo está vinculado à disponibilidade de ambas as regiões. Se a região secundária ficar inativa, as mensagens não poderão ser reconhecidas ou confirmadas.

Comparação da consistência da replicação

Com replicação síncrona:

A latência é maior devido à confirmação distribuída.
A disponibilidade está ligada à disponibilidade de duas regiões. Se uma região ficar inativa, seu namespace não estará disponível.
Os dados recebidos residem sempre em pelo menos duas regiões (apenas duas regiões suportadas na pré-visualização pública inicial).

A replicação síncrona oferece a maior garantia de que seus dados estão seguros. Se você tiver replicação síncrona, quando ela for confirmada, ela será confirmada em todas as regiões configuradas para replicação geográfica. No entanto, quando a replicação síncrona está habilitada, a disponibilidade do aplicativo pode ser reduzida devido à dependência da disponibilidade de ambas as regiões.

Habilitar a replicação assíncrona não afeta muito a latência e a disponibilidade do serviço não é afetada pela perda de uma região secundária. A replicação assíncrona não tem a garantia absoluta de que todas as regiões têm os dados antes de a replicação ser confirmada, como a replicação síncrona. Você também pode definir a quantidade de tempo que o secundário pode ficar fora de sincronia antes que o tráfego de entrada seja limitado. A configuração pode ser de 5 minutos a 1.440 minutos, que é um dia. Se você deseja usar regiões com uma grande distância entre elas, a replicação assíncrona é provavelmente a melhor opção para você.

A configuração da consistência da replicação pode ser alterada após a configuração da replicação geográfica. Você pode ir de síncrono para assíncrono ou de assíncrono para síncrono. Se você passar de síncrono para assíncrono, a latência e a disponibilidade do aplicativo melhorarão. Se você passar de assíncrono para síncrono, o secundário será configurado como síncrono depois que o atraso atingir zero. Se você estiver executando com um atraso contínuo por qualquer motivo, talvez seja necessário pausar seus editores para que o atraso chegue a zero e seu modo possa alternar para síncrono.

Os motivos gerais para habilitar a replicação síncrona estão ligados à importância dos dados, às necessidades específicas dos negócios ou aos motivos de conformidade. Se o seu objetivo principal for a disponibilidade do aplicativo em vez da garantia de dados, a consistência assíncrona é provavelmente a melhor escolha.

Seleção de região secundária

Para habilitar o recurso de replicação geográfica, você precisa usar uma região primária e secundária onde o recurso de replicação geográfica está habilitado. Você também precisa ter o cluster de Hubs de Eventos já existente nas regiões primária e secundária.

O recurso de replicação geográfica depende da capacidade de replicar eventos publicados da região primária para a secundária. Se a região secundária estiver em outro continente, isso terá um grande impacto no atraso de replicação da região primária para a secundária. Se estiver usando a replicação geográfica por motivos de disponibilidade e confiabilidade, é melhor que as regiões secundárias estejam pelo menos no mesmo continente, sempre que possível. Para entender melhor a latência induzida pela distância geográfica, você pode aprender mais com as estatísticas de latência de ida e volta da rede do Azure | Microsoft Learn.

Gerenciamento de replicação geográfica

O recurso de replicação geográfica permite configurar uma região secundária para replicar a configuração e os dados. Pode:

Configurar replicação geográfica - As regiões secundárias podem ser configuradas em qualquer namespace existente em um cluster dedicado de autoatendimento em uma região com o conjunto de recursos de replicação geográfica habilitado. Ele também pode ser configurado durante a criação de namespace nos mesmos clusters dedicados. Para selecionar uma região secundária, você deve ter um cluster dedicado disponível nessa região secundária e a região secundária também deve ter o conjunto de recursos de replicação geográfica habilitado para essa região.
Configurar a consistência da replicação - A replicação síncrona e assíncrona é definida quando a replicação geográfica é configurada, mas também pode ser comutada posteriormente. Com consistência assíncrona, você pode configurar a quantidade de tempo que uma região secundária pode atrasar.
Disparar promoção/failover - Todas as promoções ou failovers são iniciadas pelo cliente. Durante a promoção, você pode optar por torná-la forçada desde o início, ou até mesmo mudar de ideia depois que uma promoção começar e torná-la forçada.
Remover uma secundária - Se, a qualquer momento, pretender remover o emparelhamento geográfico entre regiões primárias e secundárias, pode fazê-lo e os dados na região secundária serão eliminados.

Monitorando a replicação de dados

Os usuários podem monitorar o progresso do trabalho de replicação monitorando a métrica de atraso de replicação nos logs do Application Metrics.

Habilite os logs de Métricas de Aplicativo em seu namespace de Hubs de Eventos após o Monitoramento de Hubs de Eventos do Azure - Hubs de Eventos do Azure | Microsoft Learn.
Depois que os logs do Application Metrics estiverem habilitados, você precisará produzir e consumir dados do namespace por alguns minutos antes de começar a ver os logs.
Para exibir os logs de Métricas de Aplicativos, navegue até a seção Monitoramento da página Hubs de Eventos e selecione Logs no menu à esquerda. Você pode usar a consulta a seguir para localizar o atraso de replicação (em segundos) entre os namespaces primário e secundário.
```
AzureDiagnostics
  | where TimeGenerated > ago(1h)
  | where Category == "ApplicationMetricsLogs"
  | where ActivityName_s == "ReplicationLag
```
A coluna count_d indica o atraso de replicação em segundos entre a região primária e secundária.

Publicação de dados

As aplicações de publicação de eventos podem publicar dados em namespaces geograficamente replicados através do FQDN estável do namespace replicado geo. A abordagem de publicação de eventos é a mesma que o caso não-Geo DR e nenhuma alteração nos aplicativos cliente é necessária.

A publicação de eventos pode não estar disponível durante as seguintes circunstâncias:

Durante o período de cortesia de Failover, a região primária existente rejeita quaisquer novos eventos publicados no hub de eventos.
Quando o atraso de replicação entre as regiões primária e secundária atinge a duração máxima permitida, a carga de trabalho de entrada do publicador pode ser limitada. Os aplicativos do Publisher não podem acessar diretamente nenhum namespace nas regiões secundárias.

Consumindo dados

As aplicações que consomem eventos podem efetuar a leitura de dados utilizando o FQDN do namespace estável de um namespace geograficamente replicado. As operações do consumidor não são suportadas, desde o início do failover até à sua conclusão.

Gestão de Pontos de Verificação/Deslocamento

As aplicações que consomem eventos podem continuar a manter a gestão de offset como fariam com um único namespace.

Kafka

As compensações são confirmadas diretamente nos Hubs de Eventos e as compensações são replicadas entre regiões. Portanto, os consumidores podem começar a consumir de onde pararam na região primária.

SDK de Hubs de Eventos/AMQP

Os clientes que usam o SDK de Hubs de Eventos precisam atualizar para a versão de abril de 2024 do SDK. A versão mais recente do SDK de Hubs de Eventos oferece suporte a failover com uma atualização para o ponto de verificação. O ponto de verificação é gerido por utilizadores que possuem um armazenamento de ponto de verificação, como o Azure Blob Storage, ou uma solução de armazenamento personalizada. Se ocorrer um failover, o armazenamento de pontos de verificação deve estar disponível na região secundária para que os clientes possam recuperar os dados dos pontos de verificação e evitar a perda de mensagens.

Preços

Os preços dos clusters dedicados dos Hubs de Eventos são calculados independentemente da replicação geográfica. O uso da replicação geográfica com Hubs de Eventos dedicados exige que você tenha pelo menos dois clusters dedicados em regiões separadas. Os clusters dedicados usados como instâncias secundárias para replicação geográfica podem ser usados para outras cargas de trabalho. Há uma cobrança pela replicação geográfica com base na largura de banda publicada * o número de regiões secundárias. A taxa de replicação geográfica é dispensada na pré-visualização pública inicial.

Para saber como usar o recurso de replicação geográfica, consulte Usar replicação geográfica.