Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
O Azure Device Registry armazena informações sobre ativos e dispositivos na cloud. O Registo de Dispositivos projeta ativos como recursos Azure na cloud dentro de um único registo. O registro único é uma fonte de verdade para metadados de dispositivos e ativos e recursos de gerenciamento de ativos. O Registro de Dispositivo pode ser usado em conjunto com as Operações do Azure IoT.
Quando você usa o Azure, a confiabilidade é uma responsabilidade compartilhada. A Microsoft fornece uma variedade de recursos para oferecer suporte à resiliência e à recuperação. Você é responsável por entender como esses recursos funcionam em todos os serviços que você usa e selecionar os recursos necessários para atender aos seus objetivos de negócios e metas de tempo de atividade.
Este artigo descreve como tornar o Registo de Dispositivos resiliente a uma variedade de potenciais interrupções e problemas, incluindo falhas transitórias, falhas em zonas de disponibilidade e interrupções regionais.
Note
O Azure IoT Operations inclui vários outros componentes além do Registro de Dispositivo. Para obter informações detalhadas sobre os recursos de alta disponibilidade e zero perda de dados dos componentes do Azure IoT Operations, consulte as perguntas frequentes sobre Operações do Azure IoT.
Resiliência a falhas transitórias
Falhas transitórias são falhas curtas e intermitentes em componentes. Eles ocorrem com frequência em um ambiente distribuído, como a nuvem, e são uma parte normal das operações. As falhas transitórias corrigem-se após um curto período de tempo. É importante que seus aplicativos possam lidar com falhas transitórias, geralmente tentando novamente as solicitações afetadas.
Todos os aplicativos hospedados na nuvem devem seguir as diretrizes de tratamento de falhas transitórias do Azure quando se comunicam com quaisquer APIs, bancos de dados e outros componentes hospedados na nuvem. Para obter mais informações, consulte Recomendações para o tratamento de falhas transitórias.
Os clientes interagem com o Registro de Dispositivo usando o Gerenciador de Recursos do Azure. Geralmente, você usa o portal do Azure, a CLI do Azure ou os SDKs do Azure para interagir com recursos do Registro de Dispositivo, e essas ferramentas fornecem tratamento automático de falhas transitórias. Se você usar as APIs do Gerenciador de Recursos diretamente, certifique-se de lidar com falhas transitórias.
Resiliência a falhas na zona de disponibilidade
As zonas de disponibilidade são grupos fisicamente separados de centros de dados dentro de uma região Azure. Quando uma zona falha, os serviços podem fazer failover para uma das zonas restantes.
O Registro de Dispositivo do Azure é redundante de zona por padrão, o que significa que ele replica automaticamente seus dados em várias zonas de disponibilidade. Essa configuração aumenta a resiliência do serviço, fornecendo alta disponibilidade. Se houver uma falha em uma zona, o serviço pode continuar a operar perfeitamente a partir de outra zona.
A Microsoft gerencia a instalação e a configuração para redundância de zona no Registro de Dispositivo do Azure. Não é necessário executar mais nenhuma configuração para habilitar essa redundância de zona. A Microsoft garante que o serviço esteja configurado para fornecer o mais alto nível de disponibilidade e confiabilidade.
Suporte de região
A seguinte lista de regiões suporta zonas de disponibilidade no Registo de Dispositivos:
| Américas | Europa |
|---|---|
| E.U.A. Leste | Alemanha Centro-Oeste |
| E.U.A. Leste 2 | Europa do Norte |
| E.U.A. Oeste | Europa Ocidental |
| E.U.A. Oeste 2 | |
| E.U.A. Oeste 3 |
Cost
Não há custo extra para usar a redundância de zona para o Registo de Dispositivos.
Configurar o suporte à zona de disponibilidade
Novos recursos: Quando cria um recurso de Registo de Dispositivos no Azure IoT Operations, ele inclui automaticamente redundância de zona por defeito. Não há necessidade de realizar mais nenhuma configuração.
Comportamento quando todas as zonas estão íntegras
As informações a seguir descrevem o que acontece quando você tem um registro de dispositivo com redundância de zona e todas as zonas de disponibilidade estão operacionais:
Roteamento de tráfego entre zonas: As solicitações são distribuídas automaticamente em cada zona de disponibilidade. Uma solicitação pode ir para uma instância do Registro de Dispositivo em qualquer zona de disponibilidade.
Replicação de dados entre zonas: Os dados do dispositivo são replicados de forma síncrona entre zonas de disponibilidade.
Comportamento durante uma falha de zona
As informações a seguir descrevem o que acontece quando você tem um registo de dispositivos redundante por zonas e uma zona de disponibilidade sofre uma interrupção.
- Deteção e resposta: Como o Registo de Dispositivos deteta e responde automaticamente a falhas numa zona de disponibilidade, não é necessário fazer nada para iniciar um failover de zona de disponibilidade.
- Notificação: a Microsoft não o notifica automaticamente quando uma zona está inativa. No entanto, você pode usar a Integridade do Serviço do Azure para entender a integridade geral do serviço, incluindo quaisquer falhas de zona, e pode configurar alertas de Integridade do Serviço para notificá-lo sobre problemas.
Solicitações ativas: Algumas solicitações ativas podem ser descartadas e, portanto, podem precisar ser repetidas da mesma forma que outras falhas transitórias. Para garantir que a sua aplicação é resiliente a quaisquer falhas transitórias, consulte Resiliência a falhas transitórias.
Perda de dados esperada: Não se espera que uma falha de zona cause perda de dados.
Tempo de inatividade esperado: Não se espera que uma falha de zona cause tempo de inatividade aos seus recursos.
Recuperação de zona
Quando a zona de disponibilidade recupera, o Registo de Dispositivos restaura automaticamente as operações na zona de disponibilidade.
Teste de falhas de zona
A plataforma Device Registry gere o encaminhamento de tráfego, o failover e o failback entre zonas de disponibilidade. Você não precisa iniciar nada. Como esse recurso é totalmente gerenciado, não é necessário validar os processos de falha da zona de disponibilidade.
Resiliência a falhas em toda a região
O Registro de Dispositivo é um serviço de região única. Se a região ficar indisponível, os recursos do Registro de Dispositivo também ficarão indisponíveis.
No entanto, os dados do seu registo são replicados para a região emparelhada. No caso de uma interrupção prolongada da região, a Microsoft pode optar por realizar um failover para a região emparelhada. Se isso acontecer, o seu registo continuará disponível na região emparelhada.
Suporte de região
A replicação padrão e o failover são suportados em todas as regiões em que o Registo de Dispositivos está disponível, porque todas estas regiões estão emparelhadas.
Cost
Não há custo extra para replicação ou failover de dados entre regiões.
Configurar a replicação e preparar-se para failover
Por padrão, a replicação de dados entre regiões é configurada automaticamente quando você cria recursos do Registro de Dispositivo em uma região com um par. Este processo é uma opção padrão e não requer nenhuma intervenção sua.
Comportamento quando todas as regiões estão saudáveis
Esta seção descreve o que esperar quando um registro de dispositivo é configurado para replicação e failover entre regiões e a região primária está operacional.
Replicação de dados entre regiões: Os dados são replicados automaticamente para a região emparelhada. A replicação ocorre de forma assíncrona, o que significa que alguma perda de dados é esperada se ocorrer um failover.
Roteamento de tráfego entre regiões: Em operações normais, o tráfego flui apenas para a região primária.
Comportamento durante uma interrupção regional
Esta secção descreve o que esperar quando um registo de dispositivos é configurado para replicação e failover entre regiões e ocorre uma interrupção na região primária.
Deteção e resposta: A Microsoft pode decidir executar um failover se a região primária for perdida. Esse processo pode levar várias horas após a perda da região primária, ou até mais em alguns cenários. O failover de recursos do Registro de Dispositivos pode não ocorrer simultaneamente com outros serviços do Azure.
Notificação: Os eventos de falha de região podem ser monitorados por meio da Integridade do Serviço do Azure. Configure alertas para receber notificações de problemas no nível da região.
Solicitações ativas: Quaisquer solicitações que a região primária esteja processando durante um failover provavelmente serão perdidas. Os clientes devem repetir as solicitações após a conclusão do failover.
Perda de dados esperada: Os dados são replicados de forma assíncrona para a região emparelhada. Como resultado, alguma perda de dados é esperada após o failover. Você pode esperar menos de 15 minutos de perda de dados após um failover de região.
Tempo de inatividade esperado: Espere aproximadamente 24 horas de tempo de inatividade desde quando a região é perdida até quando o recurso está disponível na região emparelhada.
Reencaminhamento do tráfego: Durante o processo de failover, o Registro de Dispositivo atualiza os registros DNS para apontar para a região emparelhada. Todas as solicitações subsequentes são enviadas para a região emparelhada.
Após a conclusão da operação de failover para o registro, espera-se que todas as operações do dispositivo e dos aplicativos back-end continuem funcionando sem a necessidade de intervenção manual.
Recuperação da região
Quando a região principal recupera, o Registo de Dispositivos restaura automaticamente as operações na região.
Teste para falhas regionais
A plataforma Device Registry gere o roteamento de tráfego, failover e failback entre regiões emparelhadas. Você não precisa iniciar nada. Como esse recurso é totalmente gerenciado, você não precisa validar processos de falha de região emparelhada.