Monitorare un singolo cluster Azure Stack HCI versione 23H2 con Insights
Si applica a: Azure Stack HCI, versione 23H2
Questo articolo descrive come usare Insights per monitorare un singolo cluster Azure Stack HCI. Per più cluster Azure Stack HCI, vedere Monitorare più cluster Azure Stack HCI con Insights.
Insights è una funzionalità di Monitoraggio di Azure che consente di iniziare rapidamente a monitorare il cluster Azure Stack HCI. È possibile visualizzare le metriche chiave, l'integrità e l'utilizzo relative a cluster, server, macchine virtuali e archiviazione.
Per guardare la procedura dettagliata video in Insights for Azure Stack HCI, vedere alcuni istanti:
Vantaggi
Insights per Azure Stack HCI offre i vantaggi seguenti:
Gestito da Azure. Insights viene gestito da Azure ed è accessibile tramite il portale di Azure, assicurandosi che sia sempre aggiornato. Non c'è bisogno di un database o di una configurazione software speciale.
Scalabilità. Insights è in grado di caricare più di 400 set di informazioni del cluster tra più sottoscrizioni contemporaneamente. Non esistono limitazioni per il cluster, il dominio o la posizione fisica.
Personalizzabilità. L'esperienza di Insight si basa sui modelli di cartella di lavoro di Monitoraggio di Azure. In questo modo è possibile modificare le visualizzazioni e le query, modificare o impostare soglie allineate ai limiti specifici e quindi salvare queste personalizzazioni in una cartella di lavoro. È quindi possibile aggiungere grafici nelle cartelle di lavoro ai dashboard di Azure.
Prerequisiti
Ecco i prerequisiti per l'uso di Insights per Azure Stack HCI:
È necessario avere accesso a un cluster Azure Stack HCI distribuito e registrato.
L'identità gestita per la risorsa di Azure deve essere abilitata. Per altre informazioni, vedere Abilitazione della gestione avanzata.
Abilitare le informazioni dettagliate
L'abilitazione di Insights consente di monitorare tutti i cluster Azure Stack HCI attualmente associati all'area di lavoro Log Analytics fornendo metriche di integrità utili. Insights installa l'agente di Monitoraggio di Azure e consente di configurare le regole di raccolta dati per il monitoraggio del cluster Azure Stack HCI.
Per abilitare Informazioni dettagliate su larga scala, vedere Abilitare Insights per Azure Stack HCI su larga scala usando i criteri di Azure.
Seguire questa procedura per abilitare Informazioni dettagliate dal portale di Azure:
Nella portale di Azure passare alla pagina della risorsa cluster Azure Stack HCI e quindi selezionare il cluster. Nella scheda Funzionalità selezionare Informazioni dettagliate.
Nella pagina Informazioni dettagliate selezionare Attività iniziali.
Nella pagina di configurazione di Insights selezionare un record di dominio esistente dall'elenco a discesa Regola raccolta dati. DCR specifica i registri eventi e i contatori delle prestazioni che devono essere raccolti e archiviati in un'area di lavoro Log Analytics. Insights crea un record di dominio predefinito se non ne esiste già uno. Sono inclusi solo i controller di dominio abilitati per Insights.
(Facoltativo) È anche possibile creare un nuovo DCR selezionando Crea nuovo nella pagina di configurazione di Insights.
Importante
È consigliabile non creare il proprio record di dominio. Il record di controllo di dominio creato da Insights include un flusso di dati speciale necessario per l'operazione. È possibile modificare questo DCR per raccogliere più dati, ad esempio eventi Di Windows e Syslog. I controller di dominio creati tramite l'installazione ama avranno un prefisso
AzureStackHCI-
associato al nome del record di dominio.Nella pagina Nuova regola di raccolta dati specificare la sottoscrizione, il nome DCR e il nome dell'endpoint di raccolta dati.On the New data collection rule page, specify the subscription, DCR name, and data collection endpoint (DCE) name. I controller di dominio vengono usati per accedere al servizio di configurazione per recuperare i controller di dominio associati per l'agente di Monitoraggio di Azure. Per altre informazioni su DCE, vedere Endpoint di raccolta dati in Monitoraggio di Azure.
Nota
Se si usano collegamenti privati nell'agente, è necessario aggiungere controller di dominio. Per altre informazioni sulle impostazioni di rete ama, vedere Definire le impostazioni di rete dell'agente di Monitoraggio di Azure.
Selezionare il pulsante Rivedi e crea.
Se un record di controllo di dominio non è già stato creato per il cluster non monitorato, ne viene creato uno con contatori delle prestazioni abilitati e il canale del registro eventi di Windows abilitato.
Esaminare la schermata finale con un riepilogo del nome del Registro Azure Container, il numero di registri eventi, i contatori delle prestazioni e il nome dell'area di lavoro Log Analytics in cui vengono archiviati i dati. Selezionare Set up (Configura).
Dopo aver selezionato Configura, si verrà reindirizzati alla pagina Estensioni , in cui è possibile visualizzare lo stato dell'installazione dell'agente. Configurando Insights, Ama viene installato automaticamente in tutti i nodi del cluster.
Passare alla pagina della risorsa cluster Azure Stack HCI e quindi selezionare il cluster. Insights ora viene visualizzato come Configurato nella scheda Funzionalità :
Regole di raccolta dati
Quando si abilita Insights in un computer con l'agente di Monitoraggio di Azure, è necessario specificare un DCR da usare. Per altre informazioni sui controller di dominio di dominio, vedere Regole di raccolta dati in Monitoraggio di Azure.
Opzione | Descrizione |
---|---|
Contatori delle prestazioni | Specifica i contatori delle prestazioni dei dati da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. Questi contatori delle prestazioni vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, la cartella di lavoro di Insights usa cinque contatori delle prestazioni : Memory()\Available Bytes , Network Interface()\Bytes Total/sec , Processor(_Total)\% Processor Time RDMA Activity()\RDMA Inbound Bytes/sec , eRDMA Activity()\RDMA Outbound Bytes/sec |
Canale del registro eventi | Specifica i registri eventi di Windows da raccogliere dal sistema operativo. Questa opzione è obbligatoria per tutti i computer. I log eventi di Windows vengono usati per popolare le visualizzazioni nella cartella di lavoro di Insights. Attualmente, i dati vengono raccolti tramite due canali del registro eventi di Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational |
area di lavoro Log Analytics | Area di lavoro per archiviare i dati. Vengono elencate solo le aree di lavoro con Informazioni dettagliate. |
Canale eventi
Il Microsoft-windows-sddc-management/operational
canale eventi e Microsoft-windows-health/operational
Windows viene aggiunto all'area di lavoro Log Analytics nei registri eventi di Windows.
Raccogliendo questi log, Insights mostra lo stato di integrità dei singoli server, unità, volumi e macchine virtuali. Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni.
Contatori delle prestazioni
Per impostazione predefinita, vengono aggiunti cinque contatori delle prestazioni:
Nella tabella seguente vengono descritti i contatori delle prestazioni monitorati:
Contatori delle prestazioni | Descrizione |
---|---|
Memoria(*)\Byte disponibili | Byte disponibili è la quantità di memoria fisica, in byte, immediatamente disponibile per l'allocazione a un processo o per l'uso del sistema. |
Interfaccia di rete (*)\Totale byte/sec | Frequenza con cui i byte vengono inviati e ricevuti su ogni scheda di rete, inclusi i caratteri di frame. Byte Totale/sec è una somma di byte ricevuti/sec e byte inviati/sec. |
Processore(_Total)% tempo processore | Percentuale di tempo trascorso in cui tutti i thread di processo hanno usato il processore per le istruzioni di esecuzione. |
Attività RDMA(*)\RDMA Byte in ingresso/sec | Frequenza dei dati ricevuti tramite RDMA dalla scheda di rete al secondo. |
Attività RDMA(*)\RDMA Byte in uscita/sec | Frequenza dei dati inviati tramite RDMA dalla scheda di rete al secondo. |
Dopo aver abilitato Insights, la raccolta dei dati può richiedere fino a 15 minuti. Al termine del processo, è possibile visualizzare una visualizzazione completa dell'integrità del cluster dal menu Insights nel riquadro sinistro:
Disabilitare Insights
Per disabilitare Insights, seguire questa procedura:
Selezionare Informazioni dettagliate nella scheda Funzionalità .
Selezionare Disabilita informazioni dettagliate.
Quando si disabilita la funzionalità Insights, l'associazione tra la regola di raccolta dati e il cluster viene eliminata e i log di gestione Servizio integrità e SDDC non vengono più raccolti, ma i dati esistenti non vengono eliminati. Per eliminare tali dati, accedere all'area di lavoro DCR e Log Analytics ed eliminare i dati manualmente.
Aggiornare Insights
Il riquadro Insights mostra un messaggio Di aggiornamento necessario nei casi seguenti:
- Viene modificata una regola di raccolta dati.
- Viene eliminato un evento di integrità dal registro eventi di Windows.
- Uno dei cinque contatori delle prestazioni dell'area di lavoro Log Analytics viene eliminato.
Per abilitare di nuovo Insights, seguire questa procedura:
Selezionare il riquadro Informazioni dettagliate in Funzionalità.
Selezionare Aggiorna per visualizzare di nuovo le visualizzazioni.
Risoluzione dei problemi
Questa sezione fornisce indicazioni per la risoluzione dei problemi relativi all'uso di Insights per Azure Stack HCI.
Risolvere i problemi relativi alla pagina cartelle di lavoro vuote senza dati popolati
Questione. Viene visualizzata una pagina Cartella di lavoro vuota senza dati popolati, come illustrato nello screenshot seguente:
Possibili cause. Potrebbero esserci diverse cause per questo problema, ad esempio la configurazione recente di Insights o una configurazione non corretta del Record di controllo di dominio associato.
Soluzione. Per risolvere il problema, seguire questa procedura in sequenza:
- Se insights è stato configurato di recente, attendere fino a un'ora affinché AMA raccolga i dati.
- Verificare la configurazione del record di controllo di dominio associato. Assicurarsi che i canali di evento e i contatori delle prestazioni vengano aggiunti come origini dati al DCR associato, come descritto nella sezione Regole di raccolta dati.
- Se il problema persiste dopo aver eseguito i passaggi precedenti e non vengono ancora visualizzati dati, contattare il supporto tecnico per assistenza.
Per indicazioni più dettagliate sulla risoluzione dei problemi, vedere Linee guida per la risoluzione dei problemi per l'agente di Monitoraggio di Azure.
Visualizzazioni di Informazioni dettagliate
Dopo aver abilitato Insights, le tabelle seguenti forniscono informazioni dettagliate su tutte le risorse.
Integrità
Fornisce errori di integrità in un cluster.
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Guasto | Breve descrizione degli errori di integrità. Facendo clic sul collegamento, viene visualizzato un pannello laterale con altre informazioni. | Nessuna unità | PoolCapacityThresholdExceeded |
Tipo di risorsa con errori | Tipo di risorsa che ha rilevato un errore. | Nessuna unità | StoragePool |
ID risorsa con errori | ID univoco per la risorsa che ha rilevato un errore di integrità. | ID univoco | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2} |
Gravità | La gravità dell'errore potrebbe essere di avviso o critica. | Nessuna unità | Avviso |
Tempo di errore iniziale | Timestamp dell'ultimo aggiornamento del server. | Datetime | 4/9/2022, 12:15:42 PM |
Server
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Server | Nomi dei server nel cluster. | Nessuna unità | VM-1 |
Ultimo aggiornamento | Data e ora dell'ultimo aggiornamento del server. | Datetime | 4/9/2022, 12:15:42 PM |
Status | Integrità delle risorse del server nel cluster. | Può essere integro, avviso, critico e altro | Healthy |
Utilizzo CPU | % del tempo in cui il processo ha usato la CPU. | Percentuale | 56% |
Utilizzo memoria | L'utilizzo della memoria del processo server è uguale al contatore Process\Private Bytes più le dimensioni dei dati mappati alla memoria. | Percentuale | 16% |
Processori logici | Numero di processori logici. | Count | 2 |
CPU | Numero di CPU. | Count | 2 |
Tempo di attività | Il tempo durante il quale un computer, in particolare un computer, è in funzione. | TimeSpan | 2,609 ore. |
Sito | Nome del sito a cui appartiene il server. | Nome del sito | SitoA |
Nome di dominio | Dominio locale a cui appartiene il server. | Nessuna unità | Contoso.local |
Macchine virtuali
Fornisce lo stato di tutte le macchine virtuali nel cluster. Una macchina virtuale può essere in uno degli stati seguenti: Running, Stopped, Failed o Other (Unknown, Starting, Snapshotting, Saving, Stopping, Pausing, Resuming, Paused, Suspended).
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Server | Il nome del server. | Nessuna unità | Sample-VM-1 |
Ultimo aggiornamento | In questo modo si ottiene la data e l'ora dell'ultimo aggiornamento del server | Datetime | 4/9/2022, 12:24:02 PM |
Totale macchine virtuali | Numero di macchine virtuali in un nodo server. | Count | 0 di 0 in esecuzione |
In esecuzione | Numero di macchine virtuali in esecuzione in un nodo del server. | Count | 2 |
Arrestato | Numero di macchine virtuali arrestate in un nodo del server. | Count | 3 |
Non riuscito | Numero di macchine virtuali non riuscite in un nodo del server. | Count | 2 |
Altro | Se la macchina virtuale si trova in uno degli stati seguenti (Unknown, Starting, Snapshotting, Saving, Stopping, Pausing, Resuming, Paused, Suspended), viene considerato come "Altro". | Count | 2 |
Storage
La tabella seguente fornisce l'integrità dei volumi e delle unità nel cluster:
Metrico | Descrizione | Unità | Esempio |
---|---|---|---|
Volumi | Nome del volume | Nessuna unità | ClusterPerformanceHistory |
Ultimo aggiornamento | Data e ora dell'ultimo aggiornamento dello spazio di archiviazione. | Datetime | 14/4/2022, 2:58:55 PM |
Status | Stato del volume. | Integro, avviso, critico e altro. | Healthy |
Capacità totale | Capacità totale del dispositivo in byte durante il periodo di report. | Byte | 2.5 GB |
Capacità disponibile | Capacità disponibile in byte durante il periodo di report. | Byte | 20B |
Iops | Operazioni di I/O al secondo. | Al secondo | 45/s |
Velocità effettiva | Numero di byte al secondo distribuiti dal gateway applicazione. | Byte al secondo | 5B/s |
Latenza | Tempo necessario per il completamento della richiesta di I/O. | Secondo | 0.0016 s |
Resilienza | Capacità di ripristino da errori. Ottimizza la disponibilità dei dati. | Nessuna unità | Specchio a tre vie |
Deduplicazione | Processo di riduzione del numero fisico di byte di dati che devono essere archiviati su disco. | Disponibile o meno | Sì/No |
File system | Tipo di file system. | Nessuna unità | ReFS |
Prezzi di Monitoraggio di Azure
Quando si abilita la visualizzazione di monitoraggio, i log vengono raccolti da:
- Gestione dell'integrità (Microsoft-windows-health/operational).
- Gestione SDDC (Microsoft-Windows-SDDC-Management/Operational; ID evento: 3000, 3001, 3002, 3003, 3004).
Vengono fatturati in base alla quantità di dati inseriti e alle impostazioni di conservazione dei dati dell'area di lavoro Log Analytics.
Monitoraggio di Azure ha prezzi con pagamento in base al consumo e i primi 5 GB per account di fatturazione al mese sono gratuiti. Poiché i prezzi possono variare a causa di più fattori, ad esempio l'area di Azure in uso, visitare il calcolatore prezzi di Monitoraggio di Azure per i calcoli dei prezzi più aggiornati.