Projetar e arquitetar o Azure ExpressRoute para resiliência

O Azure ExpressRoute é um serviço essencial de conectividade híbrida amplamente usado por sua conectividade privada de baixa latência, resiliência e alta taxa de transferência entre a rede local e as cargas de trabalho do Azure. Ele oferece a capacidade de obter confiabilidade, resiliência e recuperação de desastre em conexões de rede entre o local e o Azure para garantir a disponibilidade de cargas de trabalho comerciais e críticas. Essa capacidade também estende o acesso aos recursos do Azure de maneira escalonável e econômica.

Diagrama ilustrando uma conexão entre uma rede local e o Azure por meio do ExpressRoute.

As conexões de rede altamente confiáveis, resilientes e disponíveis são fundamentais para um sistema bem estruturado. A confiabilidade consiste em dois princípios: resiliência e disponibilidade. A meta de resiliência é evitar falhas e, caso ocorram, restaurar os aplicativos para um estado totalmente operacional. A meta de disponibilidade é fornecer acesso consistente ao aplicativo ou cargas de trabalho. É importante planejar proativamente a confiabilidade com base em suas necessidades comerciais e requisitos do aplicativo.

Os usuários do ExpressRoute dependem da disponibilidade e do desempenho dos sites de borda, da WAN e das zonas de disponibilidade para manter sua conectividade com o Azure. No entanto, esses componentes ou sites podem apresentar falhas devido a vários motivos, como mau funcionamento do equipamento, interrupções de rede, condições climáticas ou desastres naturais. Portanto, é uma responsabilidade conjunta entre os usuários e seu provedor de nuvem, ao planejar a confiabilidade, a resiliência e a disponibilidade.

Resiliência de site para o ExpressRoute

Há três arquiteturas de resiliência do ExpressRoute que podem ser utilizadas para garantir alta disponibilidade e resiliência em suas conexões de rede entre o local e o Azure. Esses designs de arquitetura incluem:

Resiliência máxima

A arquitetura de resiliência máxima no ExpressRoute é estruturada para eliminar qualquer ponto único de falha no caminho de rede da Microsoft. Essa configuração é obtida pela configuração de um par de circuitos em dois locais distintos para a diversidade de sites com o ExpressRoute. O objetivo da resiliência máxima é aprimorar a confiabilidade, a resiliência e a disponibilidade, como resultado, garantindo o mais alto nível de resiliência para cargas de trabalho comerciais e/ou críticas. Para essas operações, recomendamos que você configure a resiliência máxima. Esse design arquitetônico é recomendado como parte do Well Architected Framework no pilar de confiabilidade. A equipe de engenharia do ExpressRoute desenvolveu uma experiência de portal guiada para ajudar você a configurar a resiliência máxima.

Diagrama ilustrando um par de circuitos do ExpressRoute, configurados em dois locais de emparelhamento distintos, entre uma rede local e a Microsoft.

Alta resiliência

A alta resiliência, também chamada de resiliência de site ou de vários sites, permite o uso de vários sites na mesma área metropolitana para conectar sua rede local por meio do ExpressRoute ao Azure. A alta resiliência oferece diversidade de site dividindo um único circuito em dois sites. A primeira conexão é estabelecida em um site e a segunda conexão em um site diferente. O objetivo da resiliência de vários sites é atenuar o efeito do isolamento e das falhas dos sites de borda, introduzindo recursos para permitir a diversidade de sites. A diversidade de sites é obtida usando um único circuito entre sites emparelhados em uma cidade metropolitana, que oferece resiliência a falhas entre borda e região. A alta resiliência fornece um nível mais alto de resiliência do site do que a resiliência padrão, mas não tanto quanto a resiliência máxima. A alta resiliência tem o mesmo preço que a resiliência padrão, com paridade de latência em dois sites. Essa arquitetura pode ser usada para cargas de trabalho comerciais e críticas em uma região. Para obter mais informações, confira ExpressRoute Metro

Diagrama ilustrando um único circuito do ExpressRoute, com cada link configurado em dois locais de emparelhamento distintos.

Resiliência padrão

A resiliência padrão no ExpressRoute é um único circuito com duas conexões configuradas em um único site. A redundância interna (ativo-ativo) é configurada para facilitar o failover entre as duas conexões do circuito. Hoje, o ExpressRoute oferece duas conexões em um único local de emparelhamento. Se ocorrer uma falha nesse site, os usuários poderão sofrer perda de conectividade com suas cargas de trabalho do Azure. Essa configuração também é conhecida como single-homed, pois representa usuários com um circuito ExpressRoute configurado com apenas um local de emparelhamento. Essa configuração é considerada a menos resiliente e não é recomendada para cargas de trabalho comerciais ou críticas, pois não oferece resiliência de site.

Diagrama ilustrando um único circuito do ExpressRoute, com cada link configurado em um único local de emparelhamento.

Resiliência zonal para o ExpressRoute

As regiões do Azure são parte integrante de sua estratégia de design e resiliência do ExpressRoute. Essas regiões são localizações geográficas dos data centers que hospedam os serviços do Azure. As regiões são interconectadas por meio de uma rede dedicada de baixa latência e são projetadas para serem altamente disponíveis, tolerantes a falhas e escalonáveis.

O Azure oferece vários recursos para garantir a resiliência regional. Um desses recursos são as zonas de disponibilidade. As zonas de disponibilidade protegem os aplicativos e os dados contra falhas no data center, abrangendo vários locais físicos em uma região. As regiões e as zonas de disponibilidade são fundamentais para o design do aplicativo e para a estratégia de resiliência. Ao utilizar zonas de disponibilidade, você pode obter maior disponibilidade e resiliência em suas implantações. Para obter mais informações, confira Regiões e zonas de disponibilidade.

Recomendamos implantar os gateways de rede virtual do ExpressRoute como redundância de zona em zonas de disponibilidade em uma região. Essas zonas de disponibilidade são locais físicos separados com infraestrutura independente (energia, resfriamento e rede). A finalidade é proteger sua conectividade de rede local com o Azure contra falhas no nível da zona. Os gateways do ExpressRoute com redundância de zona fornecem resiliência, escalabilidade e maior disponibilidade para acessar serviços críticos no Azure.

Falhas de equipamentos ou desastres em data centers regionais e zonais podem afetar as implantações de gateway do ExpressRoute em redes virtuais. Se os gateways não forem implantados como com redundância de zona, essas falhas em um data center do Azure podem afetar a capacidade dos usuários de acessar suas cargas de trabalho do Azure.

Se você tiver gateways do ExpressRoute sem redundância de zona, agora é possível migrar para um gateway habilitado para zona de disponibilidade.

Recomendações

Veja a seguir as recomendações para garantir alta disponibilidade, resiliência e confiabilidade em sua arquitetura de rede do ExpressRoute:

Recomendações de circuito do ExpressRoute

Planejar o circuito do ExpressRoute ou o ExpressRoute Direct

Durante a fase de planejamento inicial, é fundamental determinar se será configurado uma conexão do circuito do ExpressRoute ou do ExpressRoute Direct. Um circuito do ExpressRoute permite uma conexão dedicada privada ao Azure com a assistência de um provedor de conectividade. O ExpressRoute Direct permite a extensão de uma rede local diretamente na rede da Microsoft em um local de emparelhamento. Também é necessário identificar o requisito de largura de banda e o requisito do tipo de SKU do circuito para atender às suas necessidades comerciais.

Avaliar a resiliência de circuitos do ExpressRoute com redundância de vários sites

Depois de implantar circuitos do ExpressRoute com redundância de vários sites com resiliência máxima, é essencial garantir que as rotas locais sejam anunciadas nos circuitos redundantes para utilizar totalmente os benefícios da redundância de vários sites. Para avaliar a resiliência e testar o failover de circuitos e rotas redundantes, saiba mais aqui.

Planejar a configuração ativo-ativo

Para melhorar a resiliência e a disponibilidade, a Microsoft recomenda operar as duas conexões de um circuito do ExpressRoute no modo ativo-ativo. Ao permitir que duas conexões operem nesse modo, a Microsoft faz o balanceamento de carga do tráfego de rede entre as conexões por fluxo.

Diversidade da camada física

Para obter melhorar a resiliência, planeje estabelecer vários caminhos entre a borda local e os locais de emparelhamento (locais de borda do provedor/Microsoft). Essa configuração pode ser obtida com a utilização de diferentes provedores de serviços ou com o roteamento por meio de outro local de emparelhamento a partir da rede local. Para obter alta disponibilidade, é essencial manter a redundância do circuito do ExpressRoute em toda a arquitetura de rede de ponta a ponta. Isso inclui a manutenção da redundância em sua rede local e da redundância em seu provedor de serviços. Garantir a redundância nessas partes da arquitetura significa que você não deve ter um único ponto de falha.

Verifique se a BFD (Detecção de Encaminhamento Bidirecional) está habilitada e configurada

A habilitação da BFD (Detecção de Encaminhamento Bidirecional) no ExpressRoute pode acelerar a detecção de falha de vínculo entre os dispositivos MSEE e os roteadores nos quais o circuito do ExpressRoute está configurado. A Microsoft recomenda configurar os dispositivos CPE (Customer Premises Edge) com BFD. O ExpressRoute pode ser configurado em seus dispositivos de roteamento de borda ou em seus dispositivos de roteamento do Partner Edge. A BFD é habilitada por padrão nos dispositivos MSEE no lado da Microsoft.

Recomendações do gateway do ExpressRoute

Planejar gateway de rede virtual

Crie gateways de rede virtual com redundância de zona para maior resiliência e planeje gateways de rede virtual em diferentes regiões para recuperação de desastres e alta disponibilidade. Ao utilizar gateways com redundância de zona, você pode se beneficiar da resiliência de zona para acessar seus serviços críticos e escalonáveis no Azure.

Migrar para gateways do ExpressRoute com redundância de zona

A experiência de migração de gateway guiada facilita sua migração de um SKU não habilitado para Az para um gateway de SKU habilitado para Az. Esse recurso permite a criação de um gateway de rede virtual adicional na mesma sub-rede de gateway. Durante o processo de migração, o Azure transfere o plano de controle e as configurações do caminho de dados do gateway existente para o novo.

Recomendações de recuperação de desastre e alta disponibilidade

Habilitar alta disponibilidade e recuperação de desastre

Para maximizar a disponibilidade, os segmentos do cliente e do provedor de serviços no circuito do ExpressRoute devem ser arquitetados para disponibilidade e resiliência. Para recuperação de desastre, planeje cenários como interrupções de serviço regionais devido a calamidades naturais. Implemente um design de recuperação de desastre robusto para vários circuitos configurados por meio de diferentes locais de emparelhamento em regiões diferentes. Para saber mais, confira: Projetar para recuperação de desastre.

Planejar a redundância geográfica

Para o planejamento de recuperação de desastre, recomendamos configurar circuitos do ExpressRoute em vários locais e regiões de emparelhamento. Os circuitos do ExpressRoute podem ser criados na mesma área metropolitana ou em áreas metropolitanas diferentes, e diferentes provedores de serviços podem ser usados para caminhos diversos em cada circuito. Os circuitos do ExpressRoute com redundância geográfica são utilizados para criar uma conectividade de rede de back-end robusta para recuperação de desastre. Para saber mais, confira Projetar para alta disponibilidade.

Observação

O uso da VPN site a site como uma solução de backup para conectividade do ExpressRoute não é recomendado ao lidar com cargas de trabalho com uso intensivo de latência, críticas ou largura de banda. Nesses casos, é recomendável ter um design para recuperação de desastre com a resiliência de vários sites do ExpressRoute a fim de garantir a disponibilidade máxima.

Emparelhamento de rede virtual para conectividade entre redes virtuais

O emparelhamento de VNet (rede virtual) fornece um método mais eficiente e direto, permitindo que os serviços do Azure se comuniquem entre redes virtuais sem a necessidade de um gateway de rede virtual, saltos extras ou trânsito pela Internet pública. Para estabelecer a conectividade entre redes virtuais, o emparelhamento de VNet deve ser implementado para obter o melhor desempenho possível. Para obter mais informações, confira Sobre o Emparelhamento de Rede Virtual e Gerenciar o emparelhamento de VNet.

Recomendações de monitoramento e alertas

Configurar monitoramento e alertas para circuitos do ExpressRoute

Como linha de base, recomendamos configurar o Network Insights no Azure Monitor para exibir todas as métricas de circuito do ExpressRoute, incluindo o ExpressRoute Direct e o Alcance Global. No cartão de circuitos, você pode visualizar topologias e dependências para emparelhamentos, conexões e gateways. Os insights disponíveis para circuitos incluem disponibilidade, taxa de transferência e quedas de pacotes.

Configurar alertas de integridade do serviço para notificações de manutenção do circuito do ExpressRoute

O ExpressRoute usa a Integridade do Serviço do Azure para notificar você sobre a manutenção do circuito do ExpressRoute planejada e futura. Com a Integridade do Serviço, você pode exibir manutenções planejadas e passadas no portal do Azure, além de configurar alertas e notificações que melhor atendam às suas necessidades. Na Integridade do Serviço, você pode ver a manutenção Planejada e Passada. Você também pode definir alertas dentro da Integridade do Serviço para serem notificados sobre a manutenção futura.

Configurar o monitor da conexão para o ExpressRoute

O Monitor da Conexão é uma solução de monitoramento de rede baseada em nuvem que monitora a conectividade entre implantações de nuvem do Azure e instalações locais (filiais etc.). O Monitor da Conexão é uma solução baseada em agente.

Configurar o monitoramento de integridade e os alertas do gateway

Configure o monitoramento usando o Azure Monitor para disponibilidade, desempenho e escalabilidade do gateway do ExpressRoute. Quando você implanta um gateway do ExpressRoute, o Azure gerencia a computação e as funções do seu gateway. Há várias métricas de gateway disponíveis para você entender melhor o desempenho do gateway.