Condividi tramite


Osservabilità di Operatore Nexus di Azure

Il framework di osservabilità di Operatore Nexus fornisce informazioni operative sulle istanze locali. Il framework supporta la registrazione, il monitoraggio e gli avvisi (LMA), l'analisi e la visualizzazione di dati e metriche operativi (piattaforma e carichi di lavoro).

Screenshot del framework LMA (registrazione, monitoraggio e avvisi di Operatore Nexus).

Figura: Registrazione Operatore Nexus, framework monitoraggio e avvisi (LMA)

I principali punti salienti del framework di osservabilità di Operatore Nexus sono:

  • Raccolta dati centralizzata: la soluzione di osservabilità Operatore Nexus si basa su una raccolta di tutti i dati in una posizione centrale. In questa posizione è possibile osservare i dati di monitoraggio di tutte le istanze locali.
  • Strumenti ben definiti e testati: la soluzione si basa su Monitoraggio di Azure che raccoglie, analizza e agisce sui dati di telemetria dalle istanze cloud e locali.
  • Facile da imparare e usare: la soluzione semplifica l'analisi e il debug dei problemi con la possibilità di eseguire ricerche nei dati dall'interno o in tutte le istanze cloud e locali.
  • Strumenti di visualizzazione: è possibile creare dashboard e cartelle di lavoro personalizzati in base alle esigenze.
  • Strumenti di avviso integrati: si creano avvisi in base a soglie personalizzate. È possibile creare e riutilizzare modelli di avviso in tutte le istanze.

Questo articolo illustra il framework di osservabilità Operatore Nexus costituito da uno stack di componenti:

  • Monitoraggio di Azure raccoglie e aggrega i dati di registrazione dai componenti Operatore Nexus
  • L'area di lavoro Log Analytics (LAW) di Azure raccoglie e aggrega i dati di registrazione da più sottoscrizioni e tenant di Azure
  • L'analisi, la visualizzazione e gli avvisi vengono eseguiti sui dati di log aggregati.

Monitoraggio della piattaforma

Operatore Nexus offre visibilità sulle prestazioni delle distribuzioni costituite da risorse dell'infrastruttura. Sono necessari i log e le metriche da raccogliere e analizzare da queste risorse della piattaforma. Si ottengono informazioni dettagliate preziose dalla raccolta centralizzata e dall'aggregazione dei dati da tutte le origini, rispetto ai dati non aggregati.

Questi log e metriche vengono usati per osservare lo stato della piattaforma. È possibile visualizzare le prestazioni e analizzare gli errori. È possibile analizzare la causa della situazione. La visualizzazione consente di configurare gli avvisi necessari e le relative condizioni. Ad esempio, è possibile configurare gli avvisi da generare quando le risorse si comportano in modo anomalo o quando vengono raggiunte soglie. È possibile usare i log raccolti e l'analisi per eseguire il debug di eventuali problemi nell'ambiente.

Dati di monitoraggio

L'osservabilità di Operatore Nexus consente di raccogliere lo stesso tipo di dati delle altre risorse di Azure. I dati raccolti da ognuna delle istanze possono essere visualizzati nella LAW.

Per informazioni sul monitoraggio delle risorse di Azure, vedere qui.

Raccolta e routing

L'osservabilità di Operatore Nexus consente di raccogliere dati per ogni risorsa dell'infrastruttura. Il set di componenti dell'infrastruttura include:

  • Infrastruttura di rete che include CE, TOR, NPB, commutatori di gestione e il server terminal.
  • Calcolo che include server Bare Metal.
  • Piano di controllo undercloud (cluster Kubernetes responsabile della distribuzione e della gestione del ciclo di vita della piattaforma complessiva).

La raccolta di dati di log da questi livelli è abilitata per impostazione predefinita durante la creazione dell'istanza di Operatore Nexus. Questi log raccolti vengono indirizzati alla LAW di Monitoraggio di Azure.

È anche possibile raccogliere dati dai livelli tenant creati per l'esecuzione di funzioni di rete in contenitori e virtualizzate. I dati di log che è possibile raccogliere includono:

  • Raccolta di syslog da macchine virtuali (usata per i carichi di lavoro VNF o CNF).
  • Raccolta di log dai cluster Kubernetes e dalle applicazioni distribuite all'inizio.

Sarà necessario abilitare la raccolta dei log dai cluster Kubernetes del tenant e dalle macchine virtuali. È necessario seguire la procedura per distribuire gli agenti di monitoraggio di Azure. I dati verranno raccolti nella LAW di Azure.

Archiviazione dei log di Operatore Nexus

I dati nei log di Monitoraggio di Azure vengono archiviati in tabelle, ognuna delle quali ha un proprio set di proprietà univoche.

Tutti i log delle risorse in Monitoraggio di Azure hanno gli stessi campi seguiti da campi specifici del servizio, vedere lo schema comune.

I log della piattaforma Operatore Nexus vengono archiviati nelle tabelle seguenti:

Tabella Descrizione
Syslog Eventi Syslog in computer Linux che usano l'agente di Log Analytics
ContainerInventory Dettagli e stato corrente di ogni contenitore.
ContainerLog Righe di log raccolte da flussi stdout e stderr per i contenitori
ContainerNodeInventory Dettagli dei nodi che fungono da host contenitore.
InsightMetrics Metriche raccolte da Server, K8, Contenitori.
KubeEvents Eventi Kubernetes e relative proprietà.
KubeMonAgentEvents Eventi registrati dall'agente Kubernetes di Monitoraggio di Azure per errori e avvisi.
KubeNodeInventory Dettagli per i nodi che fanno parte del cluster Kubernetes
KubePodInventory Pod Kubernetes e relative proprietà
KubePVInventory Volumi persistenti Kubernetes e le relative proprietà.
KubeServices Servizi Kubernetes e relative proprietà
Heartbeat Record registrati dagli agenti di Log Analytics una volta al minuto per segnalare l'integrità dell'agente

Metriche di Operatore Nexus

La tabella "InsightMetrics" nella sezione Log contiene le metriche raccolte da computer bare metal e dal cluster Kubernetes del sottocloud. È anche possibile osservare alcune metriche selezionate raccolte dal sottocloud aprendo la scheda Metriche dal menu Monitoraggio di Azure.

Screenshot della selezione delle metriche di Monitoraggio di Azure.

Figura: Selezione delle metriche di Monitoraggio di Azure

Per informazioni dettagliate sull'uso di questo strumento, vedere Analizzare le metriche con Esplora metriche di Monitoraggio di Azure.

Cartelle di lavoro

Le cartelle di lavoro combinano testo, query di log, metriche e parametri per l'analisi dei dati e la creazione di più tipi di visualizzazioni avanzate. È possibile usare i modelli di cartella di lavoro di Azure Resource Manager di esempio per Registrazione e monitoraggio di Operatore Nexus per distribuire cartelle di lavoro di Azure all'interno di una LAW di Azure.

Avvisi

È possibile usare i modelli di avviso di Azure Resource Manager di esempio per le regole di avviso Operatore Nexus. È necessario specificare soglie e condizioni per gli avvisi. È quindi possibile distribuire questi modelli di avviso nell'ambiente locale.

Area di lavoro Log Analytics

Un'area di lavoro Log Analytics (LAW) è un ambiente univoco per registrare i dati da Monitoraggio di Azure e da altri servizi di Azure. Ogni area di lavoro ha un proprio repository dati e una configurazione, ma può combinare i dati da più servizi. Ogni area di lavoro è costituita da più tabelle dati.

È possibile creare un'unica LAW per raccogliere tutti i dati rilevanti o più aree di lavoro in base ai requisiti degli operatori.