Condividi tramite


Monitorare un singolo cluster Azure Stack HCI versione 23H2 con Insights

Si applica a: Azure Stack HCI, versione 23H2

Questo articolo descrive come usare Insights per monitorare un singolo cluster Azure Stack HCI. Per più cluster Azure Stack HCI, vedere Monitorare più cluster Azure Stack HCI con Insights.

Insights è una funzionalità di Monitoraggio di Azure che consente di iniziare rapidamente a monitorare il cluster Azure Stack HCI. È possibile visualizzare le metriche chiave, l'integrità e l'utilizzo relative a cluster, server, macchine virtuali e archiviazione.

Per guardare la procedura dettagliata video in Insights for Azure Stack HCI, vedere alcuni istanti:

Vantaggi

Insights per Azure Stack HCI offre i vantaggi seguenti:

  • Gestito da Azure. Insights viene gestito da Azure ed è accessibile tramite il portale di Azure, assicurandosi che sia sempre aggiornato. Non c'è bisogno di un database o di una configurazione software speciale.

  • Scalabilità. Insights è in grado di caricare più di 400 set di informazioni del cluster tra più sottoscrizioni contemporaneamente. Non esistono limitazioni per il cluster, il dominio o la posizione fisica.

  • Personalizzabilità. L'esperienza di Insight si basa sui modelli di cartella di lavoro di Monitoraggio di Azure. In questo modo è possibile modificare le visualizzazioni e le query, modificare o impostare soglie allineate ai limiti specifici e quindi salvare queste personalizzazioni in una cartella di lavoro. È quindi possibile aggiungere grafici nelle cartelle di lavoro ai dashboard di Azure.

Prerequisiti

Ecco i prerequisiti per l'uso di Insights per Azure Stack HCI:

  • È necessario avere accesso a un cluster Azure Stack HCI distribuito e registrato.

  • L'identità gestita per la risorsa di Azure deve essere abilitata. Per altre informazioni, vedere Abilitazione della gestione avanzata.

Abilitare le informazioni dettagliate

L'abilitazione di Insights consente di monitorare tutti i cluster Azure Stack HCI attualmente associati all'area di lavoro Log Analytics fornendo metriche di integrità utili. Insights installa l'agente di Monitoraggio di Azure e consente di configurare le regole di raccolta dati per il monitoraggio del cluster Azure Stack HCI.

Per abilitare Informazioni dettagliate su larga scala, vedere Abilitare Insights per Azure Stack HCI su larga scala usando i criteri di Azure.

Seguire questa procedura per abilitare Informazioni dettagliate dal portale di Azure:

  1. Nella portale di Azure passare alla pagina della risorsa cluster Azure Stack HCI e quindi selezionare il cluster. Nella scheda Funzionalità selezionare Informazioni dettagliate.

    Screenshot che mostra il riquadro Insights.

  2. Nella pagina Informazioni dettagliate selezionare Attività iniziali.

    Screenshot che mostra il pulsante Attività iniziali.

  3. Nella pagina di configurazione di Insights selezionare un record di dominio esistente dall'elenco a discesa Regola raccolta dati. DCR specifica i registri eventi e i contatori delle prestazioni che devono essere raccolti e archiviati in un'area di lavoro Log Analytics. Insights crea un record di dominio predefinito se non ne esiste già uno. Sono inclusi solo i controller di dominio abilitati per Insights.

    Screenshot che mostra la finestra di configurazione di Insights.

  4. (Facoltativo) È anche possibile creare un nuovo DCR selezionando Crea nuovo nella pagina di configurazione di Insights.

    Importante

    È consigliabile non creare il proprio record di dominio. Il record di controllo di dominio creato da Insights include un flusso di dati speciale necessario per l'operazione. È possibile modificare questo DCR per raccogliere più dati, ad esempio eventi Di Windows e Syslog. I controller di dominio creati tramite l'installazione ama avranno un prefisso AzureStackHCI- associato al nome del record di dominio.

    1. Nella pagina Nuova regola di raccolta dati specificare la sottoscrizione, il nome DCR e il nome dell'endpoint di raccolta dati.On the New data collection rule page, specify the subscription, DCR name, and data collection endpoint (DCE) name. I controller di dominio vengono usati per accedere al servizio di configurazione per recuperare i controller di dominio associati per l'agente di Monitoraggio di Azure. Per altre informazioni su DCE, vedere Endpoint di raccolta dati in Monitoraggio di Azure.

      Nota

      Se si usano collegamenti privati nell'agente, è necessario aggiungere controller di dominio. Per altre informazioni sulle impostazioni di rete ama, vedere Definire le impostazioni di rete dell'agente di Monitoraggio di Azure.

      Screenshot che mostra la finestra della regola di raccolta dati.

    2. Selezionare il pulsante Rivedi e crea.

      Se un record di controllo di dominio non è già stato creato per il cluster non monitorato, ne viene creato uno con contatori delle prestazioni abilitati e il canale del registro eventi di Windows abilitato.

  5. Esaminare la schermata finale con un riepilogo del nome del Registro Azure Container, il numero di registri eventi, i contatori delle prestazioni e il nome dell'area di lavoro Log Analytics in cui vengono archiviati i dati. Selezionare Set up (Configura).

    Screenshot che mostra il selettore della regola di raccolta dati.

    Dopo aver selezionato Configura, si verrà reindirizzati alla pagina Estensioni , in cui è possibile visualizzare lo stato dell'installazione dell'agente. Configurando Insights, Ama viene installato automaticamente in tutti i nodi del cluster.

  6. Passare alla pagina della risorsa cluster Azure Stack HCI e quindi selezionare il cluster. Insights ora viene visualizzato come Configurato nella scheda Funzionalità :

    Screenshot che mostra il riquadro Insights configurato.

Regole di raccolta dati

Quando si abilita Insights in un computer con l'agente di Monitoraggio di Azure, è necessario specificare un DCR da usare. Per altre informazioni sui controller di dominio di dominio, vedere Regole di raccolta dati in Monitoraggio di Azure.

Opzione Descrizione
Contatori delle prestazioni Specifica i contatori delle prestazioni dei dati da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. Questi contatori delle prestazioni vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, la cartella di lavoro di Insights usa cinque contatori delle prestazioni : Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor TimeRDMA Activity()\RDMA Inbound Bytes/sec, eRDMA Activity()\RDMA Outbound Bytes/sec
Canale del registro eventi Specifica i registri eventi di Windows da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. I log eventi di Windows vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, i dati vengono raccolti tramite due canali del registro eventi di Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational
area di lavoro Log Analytics Area di lavoro per archiviare i dati. Vengono elencate solo le aree di lavoro con Informazioni dettagliate.

Canale eventi

Il Microsoft-windows-sddc-management/operational canale eventi e Microsoft-windows-health/operational Windows viene aggiunto all'area di lavoro Log Analytics nei registri eventi di Windows.

Screenshot che mostra la finestra Aggiungi origine dati.

Raccogliendo questi log, Insights mostra lo stato di integrità dei singoli server, unità, volumi e macchine virtuali. Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni.

Contatori delle prestazioni

Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni:

Screenshot che mostra i contatori delle prestazioni aggiunti.

Nella tabella seguente vengono descritti i contatori delle prestazioni monitorati:

Contatori delle prestazioni Descrizione
Memoria(*)\Byte disponibili Byte disponibili è la quantità di memoria fisica, in byte, immediatamente disponibile per l'allocazione a un processo o per l'uso del sistema.
Interfaccia di rete (*)\Totale byte/sec Frequenza con cui i byte vengono inviati e ricevuti su ogni scheda di rete, inclusi i caratteri di frame. Byte Totale/sec è una somma di byte ricevuti/sec e byte inviati/sec.
Processore(_Total)% tempo processore Percentuale di tempo trascorso in cui tutti i thread di processo hanno usato il processore per le istruzioni di esecuzione.
Attività RDMA(*)\RDMA Byte in ingresso/sec Frequenza dei dati ricevuti tramite RDMA dalla scheda di rete al secondo.
Attività RDMA(*)\RDMA Byte in uscita/sec Frequenza dei dati inviati tramite RDMA dalla scheda di rete al secondo.

Dopo aver abilitato Insights, la raccolta dei dati può richiedere fino a 15 minuti. Al termine del processo, è possibile visualizzare una visualizzazione completa dell'integrità del cluster dal menu Insights nel riquadro sinistro:

Screenshot che mostra le visualizzazioni informazioni dettagliate.

Disabilitare Insights

Per disabilitare Insights, seguire questa procedura:

  1. Selezionare Informazioni dettagliate nella scheda Funzionalità .

  2. Selezionare Disabilita informazioni dettagliate.

    Screenshot che mostra la finestra Disabilita informazioni dettagliate.

Quando si disabilita la funzionalità Insights, l'associazione tra la regola di raccolta dati e il cluster viene eliminata e i log di gestione Servizio integrità e SDDC non vengono più raccolti, ma i dati esistenti non vengono eliminati. Per eliminare tali dati, accedere all'area di lavoro DCR e Log Analytics ed eliminare i dati manualmente.

Aggiornare Insights

Il riquadro Insights mostra un messaggio Di aggiornamento necessario nei casi seguenti:

  • Viene modificata una regola di raccolta dati.
  • Viene eliminato un evento di integrità dal registro eventi di Windows.
  • Uno dei cinque contatori delle prestazioni dell'area di lavoro Log Analytics viene eliminato.

Per abilitare di nuovo Insights, seguire questa procedura:

  1. Selezionare il riquadro Informazioni dettagliate in Funzionalità.

  2. Selezionare Aggiorna per visualizzare di nuovo le visualizzazioni.

    Screenshot che mostra la finestra Update Insights.

Risoluzione dei problemi

Questa sezione fornisce indicazioni per la risoluzione dei problemi relativi all'uso di Insights per Azure Stack HCI.

Risolvere i problemi relativi alla pagina cartelle di lavoro vuote senza dati popolati

Questione. Viene visualizzata una pagina Cartella di lavoro vuota senza dati popolati, come illustrato nello screenshot seguente:

Screenshot di una pagina Cartella di lavoro vuota.

Possibili cause. Potrebbero esserci diverse cause per questo problema, ad esempio la configurazione recente di Insights o una configurazione non corretta del Record di controllo di dominio associato.

Soluzione. Per risolvere il problema, seguire questa procedura in sequenza:

  1. Se insights è stato configurato di recente, attendere fino a un'ora affinché AMA raccolga i dati.
  2. Verificare la configurazione del record di controllo di dominio associato. Assicurarsi che i canali di evento e i contatori delle prestazioni vengano aggiunti come origini dati al DCR associato, come descritto nella sezione Regole di raccolta dati.
  3. Se il problema persiste dopo aver eseguito i passaggi precedenti e non vengono ancora visualizzati dati, contattare il supporto tecnico per assistenza.

Per indicazioni più dettagliate sulla risoluzione dei problemi, vedere Linee guida per la risoluzione dei problemi per l'agente di Monitoraggio di Azure.

Visualizzazioni di Informazioni dettagliate

Dopo aver abilitato Insights, le tabelle seguenti forniscono informazioni dettagliate su tutte le risorse.

Integrità

Fornisce errori di integrità in un cluster.

Metrico Descrizione Unità Esempio
Guasto Breve descrizione degli errori di integrità. Facendo clic sul collegamento, viene visualizzato un pannello laterale con altre informazioni. Nessuna unità PoolCapacityThresholdExceeded
Tipo di risorsa con errori Tipo di risorsa che ha rilevato un errore. Nessuna unità StoragePool
ID risorsa con errori ID univoco per la risorsa che ha rilevato un errore di integrità. ID univoco {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2}
Gravità La gravità dell'errore potrebbe essere di avviso o critica. Nessuna unità Avviso
Tempo di errore iniziale Timestamp dell'ultimo aggiornamento del server. Datetime 4/9/2022, 12:15:42 PM

Server

Metrico Descrizione Unità Esempio
Server Nomi dei server nel cluster. Nessuna unità VM-1
Ultimo aggiornamento Data e ora dell'ultimo aggiornamento del server. Datetime 4/9/2022, 12:15:42 PM
Status Integrità delle risorse del server nel cluster. Può essere integro, avviso, critico e altro Healthy
Utilizzo CPU % del tempo in cui il processo ha usato la CPU. Percentuale 56%
Utilizzo memoria L'utilizzo della memoria del processo server è uguale al contatore Process\Private Bytes più le dimensioni dei dati mappati alla memoria. Percentuale 16%
Processori logici Numero di processori logici. Count 2
CPU Numero di CPU. Count 2
Tempo di attività Il tempo durante il quale un computer, in particolare un computer, è in funzione. TimeSpan 2,609 ore.
Sito Nome del sito a cui appartiene il server. Nome del sito SitoA
Nome di dominio Dominio locale a cui appartiene il server. Nessuna unità Contoso.local

Macchine virtuali

Fornisce lo stato di tutte le macchine virtuali nel cluster. Una macchina virtuale può essere in uno degli stati seguenti: Running, Stopped, Failed o Other (Unknown, Starting, Snapshotting, Saving, Stopping, Pausing, Resuming, Paused, Suspended).

Metrico Descrizione Unità Esempio
Server Il nome del server. Nessuna unità Sample-VM-1
Ultimo aggiornamento In questo modo si ottiene la data e l'ora dell'ultimo aggiornamento del server Datetime 4/9/2022, 12:24:02 PM
Totale macchine virtuali Numero di macchine virtuali in un nodo server. Count 0 di 0 in esecuzione
In esecuzione Numero di macchine virtuali in esecuzione in un nodo del server. Count 2
Arrestato Numero di macchine virtuali arrestate in un nodo del server. Count 3
Non riuscito Numero di macchine virtuali non riuscite in un nodo del server. Count 2
Altro Se la macchina virtuale si trova in uno degli stati seguenti (Unknown, Starting, Snapshotting, Saving, Stopping, Pausing, Resuming, Paused, Suspended), viene considerato come "Altro". Count 2

Storage

La tabella seguente fornisce l'integrità dei volumi e delle unità nel cluster:

Metrico Descrizione Unità Esempio
Volumi Nome del volume Nessuna unità ClusterPerformanceHistory
Ultimo aggiornamento Data e ora dell'ultimo aggiornamento dello spazio di archiviazione. Datetime 14/4/2022, 2:58:55 PM
Status Stato del volume. Integro, avviso, critico e altro. Healthy
Capacità totale Capacità totale del dispositivo in byte durante il periodo di report. Byte 2.5 GB
Capacità disponibile Capacità disponibile in byte durante il periodo di report. Byte 20B
Iops Operazioni di I/O al secondo. Al secondo 45/s
Velocità effettiva Numero di byte al secondo distribuiti dal gateway applicazione. Byte al secondo 5B/s
Latenza Tempo necessario per il completamento della richiesta di I/O. Secondo 0.0016 s
Resilienza Capacità di ripristino da errori. Ottimizza la disponibilità dei dati. Nessuna unità Specchio a tre vie
Deduplicazione Processo di riduzione del numero fisico di byte di dati che devono essere archiviati su disco. Disponibile o meno Sì/No
File system Tipo di file system. Nessuna unità ReFS

Prezzi di Monitoraggio di Azure

Quando si abilita la visualizzazione di monitoraggio, i log vengono raccolti da:

  • Gestione dell'integrità (Microsoft-windows-health/operational).
  • Gestione SDDC (Microsoft-Windows-SDDC-Management/Operational; ID evento: 3000, 3001, 3002, 3003, 3004).

Vengono fatturati in base alla quantità di dati inseriti e alle impostazioni di conservazione dei dati dell'area di lavoro Log Analytics.

Monitoraggio di Azure ha prezzi con pagamento in base al consumo e i primi 5 GB per account di fatturazione al mese sono gratuiti. Poiché i prezzi possono variare a causa di più fattori, ad esempio l'area di Azure in uso, visitare il calcolatore prezzi di Monitoraggio di Azure per i calcoli dei prezzi più aggiornati.

Passaggi successivi