Meerdere Azure Stack HCI-clusters bewaken met Insights

Van toepassing op: Azure Stack HCI, versie 22H2

In dit artikel wordt uitgelegd hoe u Insights gebruikt om meerdere Azure Stack HCI-clusters te bewaken. Zie Azure Stack HCI bewaken met Inzichten voor één Azure Stack HCI-cluster.

Belangrijk

Als u uw Azure Stack HCI-cluster hebt geregistreerd en Insights hebt geconfigureerd vóór november 2023, verzamelen bepaalde functies die gebruikmaken van Azure Monitor Agent (AMA), zoals Arc for Servers, VM Insights, Defender for Cloud of Sentinel mogelijk niet correct logboeken en gebeurtenisgegevens. Zie de sectie Problemen met clusters oplossen die zijn geregistreerd vóór november 2023 voor hulp bij het oplossen van problemen.

Zie Voordelen, vereisten en Inzichten inschakelen voor meer informatie over de voordelen, vereisten en het inschakelen van Inzichten voor elk cluster.

Bekijk de video voor een korte inleiding:

Status, prestaties en gebruiks insights weergeven

Insights slaat de gegevens op in een Log Analytics-werkruimte, zodat gegevenstrends in de loop van de tijd krachtig kunnen worden samengevoegd en gefilterd en geanalyseerd. Er zijn geen directe kosten voor Insights. Gebruikers worden gefactureerd op basis van de hoeveelheid opgenomen gegevens en de instellingen voor gegevensretentie van hun Log Analytics-werkruimte.

U hebt toegang tot Insights vanuit Azure Monitor > Insights Hub > Azure Stack HCI. U ziet de volgende tabbladen om te schakelen tussen weergaven: Toevoegen aan bewaking, Clusterstatus, Servers, Virtuele machines, Opslag.

Resultaten filteren

De visualisatie kan worden gefilterd op verschillende abonnementen. U kunt de resultaten filteren op basis van de volgende vervolgkeuzelijsten:

  • Tijdsbereik: Met dit filter kunt u een bereik voor de trendweergave selecteren. De standaardwaarde is Afgelopen 24 uur.
  • Abonnementen: Toont de abonnementen die Azure Stack HCI-clusters hebben geregistreerd. U kunt meerdere abonnementen selecteren in dit filter.
  • HCI-clusters: Lijsten de geregistreerde Azure Stack HCI-clusters waarvoor logboeken en bewakingsmogelijkheden zijn ingeschakeld in het geselecteerde tijdsbereik. U kunt meerdere clusters in dit filter selecteren.
  • Resourcegroepen: Met dit filter kunt u alle clusters in een resourcegroep selecteren.

Toevoegen aan bewaking

Deze functie biedt details van clusters die niet worden bewaakt door de gebruiker. Als u wilt beginnen met het bewaken van een cluster, selecteert u het cluster om dat cluster te openen en selecteert u vervolgens Capabilities > Insights. Als u uw cluster niet ziet, controleert u of het onlangs verbinding heeft gemaakt met Azure.

Schermopname van het selecteren van het cluster voor bewaking.

Kolom Beschrijving Voorbeeld
Cluster De naam van het cluster. 27cls1
Azure-verbindingsstatus De HCI-resourcestatus. Verbonden
Besturingssysteemversie Het besturingssysteem bouwt op de server. 10.0.20348.10131

In de rasterweergave worden standaard de eerste 250 rijen weergegeven. U kunt de waarde instellen door de rasterrijen te bewerken, zoals wordt weergegeven in de volgende afbeelding:

Schermopname van het scherm voor het instellen van rasterwaarden.

U kunt de details in Excel exporteren door Exporteren naar Excel te selecteren, zoals wordt weergegeven in de volgende afbeelding:

Schermopname van de koppeling voor het exporteren naar Excel.

In Excel wordt de Azure-verbindingsstatus als volgt weergegeven:

  • 0: Niet geregistreerd
  • 1: Verbinding verbroken
  • 2: Niet onlangs
  • 3: Verbonden

Clusterstatus

Deze weergave biedt een overzicht van de status van clusters.

Schermopname met overzichtsinformatie over de clusterstatus.

Kolom Beschrijving Voorbeeld
Cluster De naam van het cluster. 27cls1
Laatst bijgewerkt Het tijdstempel van wanneer de server voor het laatst is bijgewerkt. 9-4-2022, 12:15:42 uur
Status Biedt de status van serverresources in het cluster. Het kan in orde, waarschuwing, kritiek of anders zijn. In orde
Resource met fout Beschrijving van welke resource de fout heeft veroorzaakt. Server, StoragePool, Subsysteem
Totaal aantal servers Het aantal servers binnen een cluster. 4

Als uw cluster ontbreekt of de status Overige weergeeft, gaat u naar de Log Analytics-werkruimte die voor het cluster wordt gebruikt en controleert u of de agentconfiguratie gegevens vastlegt uit het microsoft-windows-status-/operationeel logboek. Zorg er ook voor dat de clusters onlangs zijn verbonden met Azure en controleer of de clusters niet zijn uitgefilterd in deze werkmap.

Server

Deze weergave biedt een overzicht van de serverstatus en -prestaties, en het gebruik van geselecteerde clusters. Deze weergave is gemaakt met behulp van de servergebeurtenis-id 3000 van het gebeurtenislogboekkanaal Microsoft-Windows-SDDC-Management/Operational Windows. Elke rij kan verder worden uitgebreid om de status van het knooppunt te bekijken. U kunt communiceren met het cluster en de serverresource om naar de respectieve resourcepagina te navigeren.

Schermopname van de status van servers.

Virtuele machines

Deze weergave bevat de status van alle VM's in het geselecteerde cluster. De weergave is gebouwd met behulp van de gebeurtenis-id van de virtuele machine 3003 van het gebeurtenislogboekkanaal Microsoft-Windows-SDDC-Management/Operational Windows. Elke rij kan verder worden uitgebreid om de distributie van VM's over servers in het cluster weer te geven. U kunt communiceren met het cluster en de knooppuntresource om naar de betreffende resourcepagina te navigeren.

Schermopname van de status van virtuele machines.

Metrisch Beschrijving Voorbeeld
Clusterserver > De naam van het cluster. Bij uitbreiding worden de servers in het cluster weergegeven. Voorbeeld-VM-1
Laatst bijgewerkt De datum/tijd van wanneer de server voor het laatst is bijgewerkt. 9-4-2022, 12:24:02 uur
Totaal aantal VM's Het aantal VM's in een serverknooppunt binnen een cluster. 1 van 2 actief
Wordt uitgevoerd Het aantal VM's dat wordt uitgevoerd in een serverknooppunt in een cluster. 2
Gestopt Het aantal VM's dat is gestopt in een serverknooppunt in een cluster. 3
Mislukt Het aantal VM's is mislukt in een serverknooppunt in een cluster. 2
Anders Als de VM een van de volgende statussen heeft (Onbekend, Starten, Momentopname maken, Opslaan, Stoppen, Onderbreken, Hervatten, Onderbroken, Onderbroken), wordt dit beschouwd als 'Anders'. 2

Storage

In deze weergave ziet u de status van volumes, het gebruik en de prestaties van bewaakte clusters. Vouw een cluster uit om de status van afzonderlijke volumes te bekijken. Deze weergave is gemaakt met behulp van de volumegebeurtenis-id 3002 van het gebeurtenislogboekkanaal Microsoft-Windows-SDDC-Management/Operational Windows. De tegels bovenaan bieden een overzicht van de status van opslag.

Schermopname van de status van opslagvolumes.

Metrisch Beschrijving Voorbeeld
Clustervolume > De naam van het cluster. Bij uitbreiding worden de volumes in een cluster weergegeven. AltaylCluster1 > ClusterPerformanceHistory
Laatst bijgewerkt De datum/tijd van wanneer de opslag voor het laatst is bijgewerkt. 14-4-2022, 14:58:55 uur
Volumestatus De status van het volume. Het kan in orde, waarschuwing, kritiek of anders zijn. In orde
Grootte De totale capaciteit van het apparaat in bytes tijdens de rapportageperiode. 25B
Gebruik Het percentage van de beschikbare capaciteit tijdens de rapportageperiode. 23.54%
Iops Invoer-/uitvoerbewerkingen per seconde. 45/s
Trend De IOPS-trend.
Doorvoer Het aantal bytes per seconde dat het Application Gateway heeft verwerkt. 5B/s
Trend (B/s) De doorvoertrend.
Gemiddelde latentie Latentie is de gemiddelde tijd die nodig is om de I/O-aanvraag te voltooien. 334 μs

Inzichten aanpassen

Omdat de gebruikerservaring is gebaseerd op Azure Monitor-werkmapsjablonen, kunnen gebruikers de visualisaties en query's bewerken en opslaan als een aangepaste werkmap.

Als u de visualisatie van Azure Monitor > Insights Hub > Azure Stack HCI gebruikt, selecteert u Bewerken opslaan > als aanpassen > om een kopie van de gewijzigde versie op te slaan in een aangepaste werkmap.

Werkmappen worden opgeslagen in een resourcegroep. Iedereen met toegang tot de resourcegroep heeft toegang tot de aangepaste werkmap.

De meeste query's worden geschreven met behulp van Kusto-querytaal (KQL). Sommige query's worden geschreven met behulp van de Resource Graph Query. Raadpleeg voor meer informatie de volgende artikelen:

Ondersteuning

Als u een ondersteuningsticket voor Insights wilt openen, gebruikt u het servicetype Insights for Azure Stack HCI onder Monitoring & Management.

Gebeurtenislogboekkanaal

Inzichten en bewakingsweergaven zijn gebaseerd op het gebeurtenislogboekkanaal Microsoft-Windows-SDDC-Management/Operational Windows. Wanneer bewaking is ingeschakeld, worden de gegevens van dit kanaal opgeslagen in een Log Analytics-werkruimte.

Het interval voor de dumpcache weergeven en wijzigen

Het standaardinterval voor het dumpen van de cache is ingesteld op 3600 seconden (1 uur).

Gebruik de volgende PowerShell-cmdlets om de waarde van het cachedumpinterval weer te geven:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Gebruik de volgende cmdlets om de frequentie van cachedump te wijzigen. Als dit is ingesteld op 0, stopt het publiceren van gebeurtenissen:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Windows-gebeurtenissen in het logboekkanaal

Dit kanaal bevat vijf gebeurtenissen. Elke gebeurtenis heeft de clusternaam en Azure Resource Manager-id als EventData.

Gebeurtenis-id Gebeurtenistype:
3000 Server
3001 Station
3002 Volume
3003 Virtuele machine
3004 Cluster

Servergebeurtenis 3000 RenderedDescription kolomwaarde

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

De meeste variabelen spreken voor zichzelf uit deze JSON-informatie. De onderstaande tabel bevat echter een aantal variabelen die iets moeilijker te begrijpen zijn.

Variabele Beschrijving
m_servers Matrix van serverknooppunten.
m_statusCategory Status van de server.
m_status Status van de server. Het is een matrix die een of twee waarden kan bevatten. De eerste waarde is verplicht (0-4). De tweede waarde is optioneel (5-9).

De waarden voor de variabele m_statusCategory zijn als volgt:

Waarde Betekenis
0 In orde
1 Waarschuwing
2 Niet in orde
255 Anders

De waarden voor de variabele m_status zijn als volgt:

Waarde Betekenis
0 Omhoog
1 Buiten gebruik
2 In onderhoud
3 Koppeling
4 Normaal
5 Geïsoleerd
6 In quarantaine
7 Afvoeren
8 Afvoer voltooid
9 De afvoer is mislukt
0xffff Onbekend

Stationsgebeurtenis 3001 RenderedDescription kolomwaarde

Stationsevent 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Kolomwaarde van volumegebeurtenis 3002 RenderedDescription

Volume-gebeurtenis 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

De meeste variabelen spreken voor zich uit de bovenstaande JSON-informatie. De onderstaande tabel bevat echter een aantal variabelen die wat moeilijker te begrijpen zijn.

Variabele Beschrijving
VolumeList Matrix van volumes.
m_StatusCategory Status van volume.
m_Status Status van het volume. Het is een matrix die een of twee waarden kan bevatten. De eerste waarde is verplicht (0-4). De tweede waarde is optioneel (5-9).

De waarden voor de variabele m_statusCategory zijn als volgt:

Waarde Betekenis
0 In orde
1 Waarschuwing
2 Niet in orde
255 Anders

De waarden voor de variabele m_status zijn als volgt:

Waarde Betekenis
0 Onbekend
1 Anders
2 OK
3 Moet worden hersteld
4 Benadrukt
5 Voorspellende fout
6 Fout
7 Niet-herstelbare fout
8 Starten
9 Stoppen
10 Gestopt
11 In gebruik
12 Geen contactpersoon
13 Communicatie verloren
14 Aborted
15 Slapende
16 Ondersteunende entiteit in fout
17 Voltooid
18 Energiemodus
19 Verhuizen
0xD002 Buiten gebruik
0xD003 Opnieuw synchroniseren vereist

Kolomwaarde voor virtuele machinegebeurtenis 3003 RenderedDescription

Gebeurtenis 3003 van virtuele machine

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Kolomwaarde van clustergebeurtenis 3004 RenderedDescription

Cluster gebeurtenis 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Zie Health Service-fouten voor meer informatie over de verzamelde gegevens.

Volgende stappen

Zie voor verwante informatie: