Solucionar problemas de atualizações de solução para o Azure Local, versão 23H2
Aplica-se a: Azure Local, versão 23H2
Este artigo descreve como solucionar problemas de atualizações de solução aplicadas ao seu Azure Local para mantê-lo atualizado.
Se o seu sistema foi criado por meio de uma nova implantação do Azure Local, versão 23H2, um orquestrador foi instalado durante a implantação. O orquestrador gerencia todas as atualizações para a plataforma - SO, drivers e firmware, agentes e serviços.
A nova solução de atualização inclui uma lógica de repetição e correção. Essa lógica tenta corrigir problemas de atualização de forma sem interrupções, como tentar novamente uma execução de CAU (Cluster-Aware Update). Se uma execução de atualização não puder ser remediada automaticamente, falhará. Quando uma atualização falha, a Microsoft recomenda inspecionar os detalhes da mensagem de falha para determinar a próxima ação apropriada. Você pode tentar retomar a atualização, se apropriado, para determinar se uma nova tentativa resolverá o problema.
As verificações de prontidão são essenciais para garantir que você aplique as atualizações sem problemas, mantenha seus sistemas up-toatualizados e mantenha a funcionalidade correta do sistema. As verificações de prontidão são realizadas e relatadas separadamente em dois cenários:
Verificações de integridade do sistema que são executadas uma a cada 24 horas.
Verificações de preparação para atualização que são executadas após o download do conteúdo da atualização e antes de iniciar a instalação.
É comum que os resultados das verificações de integridade do sistema e das verificações de prontidão de atualização sejam diferentes. Isso acontece porque as verificações de preparação de atualização usam a lógica de validação mais recente da atualização de solução a ser instalada, enquanto as verificações de integridade do sistema sempre usam a lógica de validação da versão instalada.
As verificações de prontidão do sistema e pré-atualização executam validações semelhantes e categorizam três tipos de verificações de prontidão: Crítica, Aviso e Informativa.
- Crítico: Verificações de prontidão que impedem a atualização. Esse status indica problemas que você deve resolver antes de prosseguir com a atualização.
- Aviso: Verificações de preparação que também impedem a aplicação da atualização, mas você pode ignorá-las usando PowerShell. Esse status indica possíveis problemas que podem não ser graves o suficiente para interromper a atualização, mas devem ser resolvidos para garantir um processo de atualização suave.
- Informativo: verificações de prontidão que não bloqueiam a atualização. Esse status fornece informações sobre o estado do sistema e quaisquer problemas potenciais que não devem afetar o processo de atualização diretamente. Essas verificações são para seu conhecimento e podem não exigir uma ação imediata.
As etapas de solução de problemas diferem dependendo do cenário de onde provêm as verificações de prontidão.
Cenário 1: Verificações de integridade do sistema
Este cenário ocorre ao preparar para instalar atualizações do sistema no Azure Update Manager:
Na lista do sistema, exiba o estado Critical do de preparação para atualização.
Selecione um ou mais sistemas na lista e, em seguida, selecione Atualização única.
Na página Verificação de prontidão, reveja a lista de verificações de prontidão e seus resultados.
Selecione o Exibir detalhes links em Sistemas afetados.
Quando a caixa de detalhes é aberta, você pode exibir mais detalhes, resultados individuais do sistema e o de correção de
para falhas nas verificações de integridade.
Siga as instruções de correção para resolver as falhas.
Nota
As verificações de integridade do sistema são executadas a cada 24 horas, portanto, pode levar até 24 horas para que os novos resultados sejam sincronizados com o portal do Azure após a correção das falhas. Para iniciar uma nova verificação de integridade do sistema imediatamente ou solucionar problemas adicionais, consulte a seção
PowerShell.
Cenário 2: Atualizar verificações de preparação
Este cenário ocorre ao instalar e controlar atualizações do sistema no Azure Update Manager:
No Histórico, selecione a execução falhada da atualização na lista.
Na página Verificação de prontidão, reveja a lista de verificações de prontidão e seus resultados.
Selecione o Exibir detalhes links em Sistemas afetados.
Quando a caixa de detalhes é aberta, você pode exibir mais detalhes, resultados individuais do sistema e o de correção de
para falhas nas verificações de integridade.
Siga as instruções de correção para resolver as falhas e, em seguida, selecione o botão Tentar novamente para repetir as verificações de prontidão antes da atualização e Retomar a atualização.
Para solucionar problemas adicionais, consulte a seção do
PowerShell.
Cenário 1: Verificações de integridade do sistema
Para solucionar problemas de verificações de integridade do sistema por meio do PowerShell:
Para validar que as verificações de integridade do sistema falharam, execute o seguinte comando em uma das máquinas do sistema:
Get-SolutionUpdateEnvironment
Aqui está um exemplo de saída:
PS C:\Users\lcmuser> Get-SolutionUpdateEnvironment ResourceId : redmond SbeFamily : VirtualForTesting HardwareModel : Virtual Machine LastChecked : 9/12/2023 10:34:42 PM PackageVersions : {Solution: 10.2309.0.20, Services: 10.2309.0.20, Platform: 1.0.0.0, SBE: 4.0.0.0} CurrentVersion : 10.2309.0.20 CurrentSbeVersion : 4.0.0.0 LastUpdated : State : AppliedSuccessfully HealthState : Failure HealthCheckResult : {Storage Pool Summary, Storage Services Physical Disks Summary, Storage Services Physical Disks Summary, Storage Services Physical Disks Summary...} HealthCheckDate : 9/12/2023 7:03:32 AM AdditionalData : {[SBEAdditionalData, Solution Builder extension is partially installed. Please install the latest Solution Builder Extension provided by your hardware vendor. For more information, see https://aka.ms/SBE.]} HealthState : Success HealthCheckResult : {} HealthCheckDate : 8/4/2022 9:10:36 PM PS C:\Users\lcmuser>
Revise o
HealthState
em seu sistema e visualize o valorFailure
ouWarning
.Para filtrar a propriedade
HealthCheckResult
para identificar testes com falha, execute o seguinte comando:$result = Get-SolutionUpdateEnvironment $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
Aqui está um exemplo de saída:
Title : The machine proxy on each failover cluster node should be set to a local proxy server Status : FAILURE Severity : INFORMATIONAL Description : Validating cluster setup for update. Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# tests-for-cluster-updating-readiness` Title : The CAU clustered role should be installed on the failover cluster to enable self-updating mode Status : FAILURE Severity : INFORMATIONAL Description : Validating cluster setup for update. Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# tests-for-cluster-updating-readiness`
Revise o campo
Remediation
para os testes com falha e tome as medidas apropriadas para resolver as falhas.Depois de resolver as falhas, invoque as verificações de integridade do sistema novamente executando o seguinte comando:
Invoke-SolutionUpdatePrecheck -SystemHealth
Utilize o
Get-SolutionUpdateEnvironment
para confirmar que as falhas na verificação de integridade foram resolvidas. Pode levar alguns minutos para que as verificações de integridade do sistema sejam executadas.Aqui está um exemplo de saída:
PS C:\Users\lcmuser> Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate HealthState : InProgress HealthCheckResult : HealthCheckDate : 1/1/0001 12:00:00 AM PS C:\Users\lcmuser> Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate HealthState : Success HealthCheckResult : {Storage Pool Summary, Storage Subsystem Summary, Storage Services Summary, Storage Services Summary...} HealthCheckDate : 10/18/2024 11:56:49 PM
Cenário 2: Atualizar verificações de preparação
Quando as verificações de preparação da atualização falham, isso faz com que a atualização falhe no sistema. Para solucionar problemas de verificações de prontidão de atualização por meio do PowerShell:
Para validar se as verificações de preparação para atualização falharam, execute o seguinte comando em uma das máquinas do sistema:
Get-SolutionUpdate | FT Version,State,HealthCheckResult
Aqui está um exemplo de saída:
PS C:\Users\lcmuser> Get-SolutionUpdate | FT Version,State,HealthCheckResult Version State HealthCheckResult ------- ----- ----------------- 10.2405.2.7 HealthCheckFailed {Storage Subsystem Summary, Storage Pool Summary, Storage Services Physical Disks Summary, Stora... PS C:\Users\lcmuser>
Reveja o
State
da atualização e veja o valorHealthCheckFailed
.Para filtrar a propriedade
HealthCheckResult
para identificar testes com falha, execute o seguinte comando:$result = Get-SolutionUpdate $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
Aqui está um exemplo de saída:
Title : The machine proxy on each failover cluster node should be set to a local proxy server Status : FAILURE Severity : INFORMATIONAL Description : Validating cluster setup for update. Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# tests-for-cluster-updating-readiness Title : The CAU clustered role should be installed on the failover cluster to enable self-updating mode Status : FAILURE Severity : INFORMATIONAL Description : Validating cluster setup for update. Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# tests-for-cluster-updating-readiness
Revise o campo
Remediation
para os testes com falha e tome as medidas apropriadas para resolver as falhas.Depois de resolver as falhas, invoque as verificações de preparação de atualização novamente executando o seguinte comando:
Get-SolutionUpdate -Id <some ID> | Start-SolutionUpdate -PrepareOnly
Se houver um problema que faça com que uma atualização falhe, revisar o progresso detalhado da etapa para identificar onde ela falhou geralmente é a melhor maneira de determinar se o problema é algo que pode ser corrigido por meio de um simples reparo (e retomada) ou se um compromisso de suporte é necessário para resolver o problema. Os principais itens a serem observados para a etapa de falha incluem:
Falha no nome e descrição da etapa.
Em qual máquina ou servidor a etapa falhou (em caso de um problema específico da máquina).
Cadeia de caracteres de mensagem de falha (pode identificar o problema para um problema conhecido específico com correção documentada).
A Microsoft recomenda usar o portal do Azure para identificar as informações sobre a etapa que falhou, conforme mostrado em Retomar uma atualização. Como alternativa, consulte a próxima seção para saber como exibir detalhes semelhantes no PowerShell usando Start-MonitoringActionplanInstanceToComplete
.
Consulte a tabela abaixo para obter cenários de falha de atualização e diretrizes de correção.
Nomes das etapas | Tipo de emissão | Reparação dos danos |
---|---|---|
Qualquer | Perda de energia ou outra interrupção semelhante do sistema durante a atualização. | 1. Restaure a energia. 2. Execute uma verificação de integridade do sistema. 3. Retome a atualização. |
Atualizações do CAU | A execução da Atualização Consciente de Cluster (CAU) falha com um erro max retries exceeded . |
Se houver uma indicação de que várias tentativas de CAU foram feitas e que todas falharam, geralmente é melhor investigar a primeira falha. Utilize as horas de início e término da primeira falha para corresponder à saída correta de Get-CauReport e, assim, investigar melhor a falha. |
Qualquer | Memória, fonte de alimentação, driver de inicialização ou falha crítica semelhante em um ou mais nós. | Consulte Reparar um nó no Azure Local, versão 23H2 para saber como reparar o nó com falha. Uma vez que o nó tenha sido reparado, a atualização pode ser retomada. |
Você também pode coletar logs de diagnóstico para ajudar a Microsoft a identificar e corrigir os problemas.
Para coletar logs para atualizações usando o portal do Azure, consulte Retomar uma atualização.
Para coletar logs para as falhas de atualização, consulte Coletar logs de diagnóstico para o Azure Local, versão 23H2.
Para exibir um relatório de resumo de atualização detalhado usando o PowerShell, siga estas etapas no cliente que você está usando para acessar seu sistema:
Estabeleça uma sessão remota do PowerShell com a máquina. Execute o PowerShell como administrador e execute o seguinte comando:
Enter-PSSession -ComputerName <machine_IP_address> -Credential <username\password for the machine>
Obtenha todas as atualizações de soluções e, em seguida, filtre as correspondentes a uma versão específica. A versão utilizada corresponde à versão da atualização da solução que não foi instalada.
$Update = Get-SolutionUpdate | ? Version -eq "<Version string>" -verbose
Identifique o plano de ação para a execução da atualização da solução falhada.
$Failure = $update | Get-SolutionUpdateRun
Identifique o
ResourceID
para a atualização.$Failure
Aqui está um exemplo de saída:
PS C:\Users\lcmuser> $Update = Get-SolutionUpdate| ? Version -eq "10.2303.1.7" -verbose PS C:\Users\lcmuser> $Failure = $Update|Get-SolutionUpdateRun PS C:\Users\lcmuser> $Failure ResourceId : redmond/Solution10.2303.1.7/6bcc63af-b1df-4926-b2bc-26e06f460ab0 Progress : Microsoft.AzureStack.Services.Update.ResourceProvider.UpdateService.Models.Step TimeStarted : 4/21/2023 10:02:54 PM LastUpdatedTime : 4/21/2023 3:19:05 PM Duration : 00:16:37.9688878 State : Failed
Observe o
ResourceID
GUID. Este GUID corresponde aoActionPlanInstanceID
.Consulte o resumo do
ActionPlanInstanceID
que anotaste anteriormente.Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID <Action Plan Instance ID>
Aqui está o resultado de exemplo:
PS C:\Users\lcmuser> Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID 6bcc63af-b1df-4926-b2bc-26e06f460ab0
Para retomar uma execução de atualização com falha anterior, você pode repetir a execução da atualização por meio do portal do Azure ou do PowerShell.
É altamente recomendável usar o portal do Azure para navegar até a atualização com falha e selecionar o botão Tentar novamente . Essa funcionalidade está disponível nos estágios Baixar atualizações, Verificar prontidão e Instalar de uma atualização em execução.
Se você não conseguir executar novamente com êxito uma atualização com falha ou precisar solucionar um erro ainda mais, siga estas etapas:
Selecione a Exibir detalhes de um erro.
Quando a caixa de detalhes for aberta, você poderá revisar os detalhes do erro. Para obter mais informações sobre como recolher logs de diagnóstico, pode clicar no link Como recolher logs junto ao botão Abrir um pedido de suporte.
Para obter mais informações sobre como recuperar logs, consulte Recolher logs de diagnóstico para o Azure Local.
Além disso, você pode selecionar o botão Abrir um pedido de suporte, preencher as informações apropriadas e anexar os seus logs para que fiquem disponíveis para o Suporte da Microsoft.
Para obter mais informações sobre como criar um tíquete de suporte, consulte Criar uma solicitação de suporte.
Se você estiver usando o PowerShell e precisar retomar uma execução de atualização com falha anterior, use o seguinte comando:
Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate
Para retomar uma atualização com falha anterior devido a verificações de integridade de atualização em um estado de Aviso , use o seguinte comando:
Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate -IgnoreWarnings
Saiba mais sobre como Executar atualizações via PowerShell.
Saiba mais sobre como Executar atualizações através do portal do Azure.