Planejar e preparar a implantação de cluster Autônomo do Service Fabric

Artigo
06/01/2023

Execute as seguintes etapas antes de criar o cluster.

Planejar a infraestrutura de cluster

Você está prestes a criar um cluster do Service Fabric em “seus” computadores. Sendo assim, você pode decidir a quais tipos de falhas deseja que o cluster sobreviva. Por exemplo, você precisa separar as linhas de energia ou conexões de Internet fornecidas para os computadores? Além disso, considere a segurança física dos computadores. Onde os computadores estão localizados e quem precisa acessá-los? Depois de tomar essas decisões, você poderá mapear logicamente os computadores para vários domínios de falha (confira a próxima etapa). O planejamento da infraestrutura para os clusters de produção está mais envolvido do que para os clusters de teste.

Determinar o número de domínios de falha e domínios de atualização

Um domínio de falha (FD) é uma unidade física de falha e está diretamente relacionada à infraestrutura física dos data centers. Um domínio de falha consiste em componentes de hardware (computadores, comutadores, redes, entre outros) que compartilham um ponto único de falha. Embora não haja um mapeamento individual entre domínios de falha e racks, de maneira geral, cada rack pode ser considerado um domínio de falha.

Ao especificar FDs no ClusterConfig.json, você pode escolher o nome de cada FD. O Service Fabric dá suporte a FDs hierárquicos, de modo que você pode refletir a topologia da sua infraestrutura neles. Por exemplo, os seguintes FDs são válidos:

"faultDomain": "fd:/Room1/Rack1/Machine1"
"faultDomain": "fd:/FD1"
"faultDomain": "fd:/Room1/Rack1/PDU1/M1"

Um UD (Domínio de Atualização) é uma unidade lógica de nós. Durante as atualizações orquestradas do Service Fabric (atualização de aplicativo ou atualização de cluster), todos os nós em um UD são desativados para realizar a atualização, enquanto os nós em outros UDs permanecem disponíveis para atender às solicitações. As atualizações de firmware executadas em seus computadores não se aplicam a UDs, assim, é preciso fazê-las em um computador por vez.

A maneira mais simples de pensar nesses conceitos é considerar os FDs como a unidade de falha não planejada e as UDs como a unidade de manutenção planejada.

Ao especificar UDs no ClusterConfig.json, você pode escolher o nome de cada UD. Por exemplo, os seguintes nomes são válidos:

"upgradeDomain": "UD0"
"upgradeDomain": "UD1A"
"upgradeDomain": "DomainRed"
"upgradeDomain": "Blue"

Para obter informações mais detalhadas sobre os FDs e UDs, confira Descrevendo um cluster do Service Fabric.

Um cluster em produção deve alcançar pelo menos três FDs para ter suporte em um ambiente de produção, se você tiver controle total sobre a manutenção e o gerenciamento dos nós, ou seja, você é responsável por atualizar e substituir os computadores. Para clusters em execução em ambientes (ou seja, instâncias de VMs do Amazon Web Services) onde você não tem controle total sobre os computadores, será necessário ter no mínimo cinco FDs no cluster. Cada FD pode ter um ou mais nós. Isso evita problemas causados por atualizações e upgrades de computadores que, dependendo do momento, podem interferir na execução de aplicativos e serviços em clusters.

Determinar o tamanho inicial do cluster

Geralmente, o número de nós no cluster é determinado com base nas suas necessidades comerciais, ou seja, quantos serviços e contêineres serão executados no cluster e quantos recursos são necessários para sustentar as cargas de trabalho. Para clusters de produção, é recomendável ter pelo menos cinco nós no cluster, alcançando 5 FDs. No entanto, conforme descrito acima, se você tem controle total sobre os nós e pode incluir três FDs, então três nós também devem fazer o trabalho.

Clusters de teste executando cargas de trabalho com monitoração de estado devem ter três nós, enquanto os clusters de teste apenas executando cargas de trabalho sem monitoração de estado só precisam de um nó. Também deve ser observado que, para fins de desenvolvimento, você pode ter mais de um nó em um determinado computador. No entanto, em um ambiente de produção, o Service Fabric dá suporte apenas a um nó por máquina virtual ou física.

Prepare as máquinas que servirão como nós

Estas são as especificações recomendadas para computadores em um cluster do Service Fabric:

Mínimo de 16 GB de RAM
Mínimo de 40 GB de espaço em disco disponível
Uma CPU de 4 núcleos ou maior
Conectividade com uma rede segura para todos os computadores
SO Windows Server instalado (versões válidas: 2012 R2, 2016, 1709 ou 1803). O Service Fabric versão 6.4.654.9590 e posterior também dá suporte ao Windows Server 2019 e 1809.
.NET Framework 4.5.1 ou posterior, instalação completa
Windows PowerShell 3.0
O serviço RemoteRegistry deve estar em execução em todos os computadores
A unidade de instalação do Service Fabric deve ser o Sistema de Arquivos NTFS
Os Logs e Alertas de Desempenho dos serviços Windows e o Log de Eventos do Windows precisam estar habilitados.
O controle de conta de usuário remoto deve ser desabilitado

Importante

O administrador do cluster que implanta e configura o cluster deve ter privilégios de administrador em cada um dos computadores. Você não pode instalar o Service Fabric em um controlador de domínio.

Baixar o pacote autônomo do Service Fabric para Windows Server

Baixe o Pacote autônomo do Service Fabric – Windows Server e descompacte o pacote para um computador de implantação que não faça parte do cluster ou para um dos computadores que farão parte do cluster.

Modificar a configuração do cluster

Para criar um cluster autônomo, você precisa criar um arquivo de configuração de cluster autônomo ClusterConfig.json, que descreve a especificação do cluster. Você pode basear o arquivo de configuração nos modelos encontrados no link abaixo.
Configurações de cluster autônomo

Para obter detalhes sobre as seções neste arquivo, confira Definições de configuração para o cluster autônomo no Windows.

Abra um dos arquivos ClusterConfig.json do pacote baixado e modifique as seguintes configurações:

Parâmetro de configuração	Descrição
NodeTypes	Os tipos de nós permitem separar os nós do cluster em vários grupos. Um cluster precisa ter pelo menos um NodeType. Todos os nós em um grupo têm as seguintes características comuns: Nome – esse é o nome do tipo de nó. Portas de ponto de extremidade – esses são pontos de extremidade nomeados (portas) associados a esse tipo de nó. Você pode usar qualquer número de porta que desejar, desde que não entre em conflito com nada mais neste manifesto e já não esteja em uso por outro aplicativo em execução no computador/VM. Propriedades de posicionamento – Descrevem as propriedades do tipo de nó que você usou como restrições de posicionamento para os serviços do sistema ou seus serviços. Essas propriedades são pares de chave/valor definidos pelo usuário que fornecem metadados extras para um determinado nó. Exemplos de propriedades de nó incluem se o nó temum disco rígido ou uma placa de vídeo, o número de eixos no disco rígido, núcleos e outras propriedades físicas. Capacidades : as capacidades do nó definem o nome e a quantidade de um recurso específico que um determinado nó tem disponível para consumo. Por exemplo, um nó pode definir que tem capacidade para uma métrica chamada "MemoryInMb" e que tem 2048 MB de memória disponível por padrão. Essas capacidades são usadas no runtime para garantir que os serviços que exigem quantidades específicas de recursos sejam colocados em nós que tenham esses recursos disponíveis nas quantidades necessárias. IsPrimary – se você tiver mais de um NodeType definido, verifique se somente um está definido como principal com o valor true, que é onde os serviços do sistema são executados. Todos os outros tipos de nó devem ser definidos para o valor false
Nós	Esses são os detalhes de cada um dos nós que fazem parte do cluster (tipo de nó, nome do nó, endereço IP, domínio de falha e domínio de atualização do nó). Os computadores nos quais você deseja que o cluster seja criado precisam ser listados aqui com os endereços IP. Se você usar o mesmo endereço IP para todos os nós, um cluster one-box será criado, que você pode usar para fins de teste. Não use clusters de uma caixa para implantar cargas de trabalho de produção.

Parâmetro de configuração

Descrição

NodeTypes

Os tipos de nós permitem separar os nós do cluster em vários grupos. Um cluster precisa ter pelo menos um NodeType. Todos os nós em um grupo têm as seguintes características comuns:
Nome – esse é o nome do tipo de nó.
Portas de ponto de extremidade – esses são pontos de extremidade nomeados (portas) associados a esse tipo de nó. Você pode usar qualquer número de porta que desejar, desde que não entre em conflito com nada mais neste manifesto e já não esteja em uso por outro aplicativo em execução no computador/VM.
Propriedades de posicionamento – Descrevem as propriedades do tipo de nó que você usou como restrições de posicionamento para os serviços do sistema ou seus serviços. Essas propriedades são pares de chave/valor definidos pelo usuário que fornecem metadados extras para um determinado nó. Exemplos de propriedades de nó incluem se o nó temum disco rígido ou uma placa de vídeo, o número de eixos no disco rígido, núcleos e outras propriedades físicas.
Capacidades : as capacidades do nó definem o nome e a quantidade de um recurso específico que um determinado nó tem disponível para consumo. Por exemplo, um nó pode definir que tem capacidade para uma métrica chamada "MemoryInMb" e que tem 2048 MB de memória disponível por padrão. Essas capacidades são usadas no runtime para garantir que os serviços que exigem quantidades específicas de recursos sejam colocados em nós que tenham esses recursos disponíveis nas quantidades necessárias.
IsPrimary – se você tiver mais de um NodeType definido, verifique se somente um está definido como principal com o valor true, que é onde os serviços do sistema são executados. Todos os outros tipos de nó devem ser definidos para o valor false

Nós

Esses são os detalhes de cada um dos nós que fazem parte do cluster (tipo de nó, nome do nó, endereço IP, domínio de falha e domínio de atualização do nó). Os computadores nos quais você deseja que o cluster seja criado precisam ser listados aqui com os endereços IP.
Se você usar o mesmo endereço IP para todos os nós, um cluster one-box será criado, que você pode usar para fins de teste. Não use clusters de uma caixa para implantar cargas de trabalho de produção.

Depois que a configuração do cluster tiver todas as configurações definidas no ambiente, ela poderá ser testada no ambiente de cluster (etapa 7).

Configuração do ambiente

Quando um administrador de cluster configura um cluster autônomo do Service Fabric, o ambiente precisa ser configurado com os seguintes critérios:

O usuário que está criando o cluster deve ter privilégios de segurança de nível de administrador para todos os computadores listados como nós no arquivo de configuração do cluster.
No computador do qual o cluster é criado, bem como em cada computador do nó de cluster, é necessário:
- Desinstalar o SDK do Service Fabric
- Desinstalar o runtime do Service Fabric
- Habilitar o serviço de Firewall do Windows (mpssvc)
- Ter o Serviço de Registro Remoto (registro remoto) habilitado
- Habilitar o compartilhamento de arquivos (SMB)
- Abrir as portas necessárias, com base nas portas de configuração de cluster
- Abrir as portas necessárias para o Serviço de Registro Remoto e o SMB do Windows: 135, 137, 138, 139 e 445
- Ter conectividade de rede com os outros computadores
Nenhum dos computadores de nó de cluster deve ser um controlador de domínio.
Se o cluster a ser implantado é um cluster seguro, valide que os pré-requisitos de segurança necessários estão em vigor e configurados corretamente em relação à configuração.
Se os computadores do cluster não são acessíveis pela Internet, defina o seguinte na configuração do cluster:
- Desabilitar a telemetria: em propriedades, defina "enableTelemetry": false
- Desabilitar o download automático da versão do Fabric e as notificações que informam que a versão do cluster atual está se aproximando do fim do suporte: em propriedades, defina "fabricClusterAutoupgradeEnabled": false
- Como alternativa, se o acesso à rede da Internet estiver limitado aos domínios na lista de permitidos, os domínios abaixo serão necessários para a atualização automática: go.microsoft.com download.microsoft.com
Defina as exclusões de antivírus do Service Fabric apropriadas:

Diretórios de Antivírus excluídos
Program Files\Microsoft Service Fabric
FabricDataRoot (da configuração de cluster)
FabricLogRoot (da configuração de cluster)

Processos do antivírus excluídos
Fabric.exe
FabricHost.exe
FabricInstallerService.exe
FabricSetup.exe
FabricDeployer.exe
ImageBuilder.exe
FabricGateway.exe
FabricDCA.exe
FabricFAS.exe
FabricUOS.exe
FabricRM.exe
FileStoreService.exe

Validar o ambiente usando o script TestConfiguration

O script TestConfiguration.ps1 pode ser encontrado no pacote autônomo. Ele é usado como um Analisador de Práticas Recomendadas para validar alguns dos critérios acima e deve ser usado como uma verificação de integridade para validar se um cluster pode ser implantado em um ambiente específico. Se houver alguma falha, consulte a lista em Configuração do Ambiente para solução de problemas.

Esse script pode ser executado em qualquer computador que tenha o acesso de administrador para todos os computadores listados como nós no arquivo de configuração do cluster. O computador no qual este script é executado não precisa fazer parte do cluster.

PS C:\temp\Microsoft.Azure.ServiceFabric.WindowsServer> .\TestConfiguration.ps1 -ClusterConfigFilePath .\ClusterConfig.Unsecure.DevCluster.json
Trace folder already exists. Traces will be written to existing trace folder: C:\temp\Microsoft.Azure.ServiceFabric.WindowsServer\DeploymentTraces
Running Best Practices Analyzer...
Best Practices Analyzer completed successfully.


LocalAdminPrivilege        : True
IsJsonValid                : True
IsCabValid                 : True
RequiredPortsOpen          : True
RemoteRegistryAvailable    : True
FirewallAvailable          : True
RpcCheckPassed             : True
NoConflictingInstallations : True
FabricInstallable          : True
Passed                     : True

No momento, este módulo de teste de configuração não valida a configuração de segurança, por isso deve ser feito de forma independente.

Observação

Estamos continuamente fazendo aprimoramentos para tornar esse módulo mais robusto, então, se há um caso com falha ou ausente que você acredita não ter sido detectado até o momento pelo TestConfiguration, informe-nos pelos nossos canais de suporte.

Próximas etapas

Criar um cluster autônomo em execução no Windows Server