Osservabilità di Nexus dell'operatore di Azure

Il framework di osservabilità Operator Nexus fornisce informazioni operative sulle istanze locali. Il framework supporta la registrazione, il monitoraggio e gli avvisi (LMA), l'analisi e la visualizzazione di dati e metriche operativi (piattaforma e carichi di lavoro).

Screenshot of Operator Nexus Logging, Monitoring and Alerting (LMA) Framework.

Figura: Operator Nexus Logging, Monitoring and Alerting Framework (LMA) Framework

I principali punti salienti del framework di osservabilità Operator Nexus sono:

  • Raccolta centralizzata dei dati: la soluzione di osservabilità Operator Nexus si basa su una raccolta di tutti i dati in una posizione centrale. In questa posizione è possibile osservare i dati di monitoraggio di tutte le istanze locali.
  • Strumenti ben definiti e testati: la soluzione si basa su Monitoraggio di Azure che raccoglie, analizza e agisce sui dati di telemetria dalle istanze cloud e locali.
  • Facile da imparare e usare: la soluzione semplifica l'analisi e il debug dei problemi con la possibilità di eseguire ricerche nei dati dall'interno o in tutte le istanze cloud e locali.
  • Strumenti di visualizzazione: è possibile creare dashboard e cartelle di lavoro personalizzati in base alle esigenze.
  • Strumenti di avviso integrati: è possibile creare avvisi in base a soglie personalizzate. È possibile creare e riutilizzare modelli di avviso in tutte le istanze.

Questo articolo illustra il framework di osservabilità Operator Nexus costituito da uno stack di componenti:

  • Monitoraggio di Azure raccoglie e aggrega i dati di registrazione dai componenti Operator Nexus
  • L'area di lavoro Log Analytics di Azure raccoglie e aggrega i dati di registrazione da più sottoscrizioni e tenant di Azure
  • L'analisi, la visualizzazione e gli avvisi vengono eseguiti sui dati di log aggregati.

Monitoraggio della piattaforma

Operator Nexus offre visibilità sulle prestazioni delle distribuzioni costituite da risorse dell'infrastruttura. Sono necessari i log e le metriche da raccogliere e analizzare da queste risorse della piattaforma. Si ottengono informazioni dettagliate preziose dalla raccolta centralizzata e dall'aggregazione dei dati da tutte le origini, rispetto ai dati non aggregati.

Questi log e metriche vengono usati per osservare lo stato della piattaforma. È possibile visualizzare le prestazioni e analizzare gli errori. È possibile analizzare la causa della situazione. La visualizzazione consente di configurare gli avvisi necessari e in quali condizioni. Ad esempio, è possibile configurare gli avvisi da generare quando le risorse si comportano in modo anomalo o quando sono state raggiunte soglie. È possibile usare i log raccolti e l'analisi per eseguire il debug di eventuali problemi nell'ambiente.

Dati di monitoraggio

L'osservabilità di Operator Nexus consente di raccogliere lo stesso tipo di dati delle altre risorse di Azure. I dati raccolti da ognuna delle istanze possono essere visualizzati nella legge.

Per informazioni sul monitoraggio delle risorse di Azure, vedere qui.

Raccolta e routing

L'osservabilità di Operator Nexus consente di raccogliere dati per ogni risorsa dell'infrastruttura. Il set di componenti dell'infrastruttura include:

  • Infrastruttura di rete che include CEs, TOR, SERVER dei criteri di rete, commutatori di gestione e il server terminal.
  • Calcolo che include server Bare Metal.
  • Piano di controllo undercloud (cluster Kubernetes responsabile della distribuzione e della gestione del ciclo di vita della piattaforma complessiva).

La raccolta di dati di log da questi livelli è abilitata per impostazione predefinita durante la creazione dell'istanza di Operator Nexus. Questi log raccolti vengono indirizzati alla legge di Monitoraggio di Azure.

È anche possibile raccogliere dati dai livelli tenant creati per l'esecuzione di funzioni di rete in contenitori e virtualizzate. I dati di log che è possibile raccogliere includono:

  • Raccolta di syslog da Macchine virtuali (usata per i carichi di lavoro VNFs o CNF).
  • Raccolta di log dai cluster Kubernetes e dalle applicazioni distribuite all'inizio.

Sarà necessario abilitare la raccolta dei log dai cluster Kubernetes del tenant e Macchine virtuali. Seguire la procedura per distribuire gli agenti di monitoraggio di Azure. I dati verranno raccolti nella legge di Azure.

Archiviazione dei log di Nexus operatore

I dati nei log di Monitoraggio di Azure vengono archiviati nelle tabelle in cui ogni tabella ha un proprio set di proprietà univoco.

Tutti i log delle risorse in Monitoraggio di Azure hanno gli stessi campi seguiti da campi specifici del servizio; vedere lo schema comune.

I log della piattaforma Operator Nexus vengono archiviati nelle tabelle seguenti:

Tabella Descrizione
syslog Eventi Syslog in computer Linux che usano l'agente di Log Analytics
ContainerInventory Dettagli e stato corrente di ogni contenitore.
ContainerLog Righe di log raccolte da flussi stdout e stderr per i contenitori
ContainerNodeInventory Dettagli dei nodi che fungono da host contenitore.
InsightMetrics Metriche raccolte da Server, K8s, Contenitori.
KubeEvents Eventi Kubernetes e relative proprietà.
KubeMonAgentEvents Eventi registrati dall'agente Kubernetes di Monitoraggio di Azure per errori e avvisi.
KubeNodeInventory Dettagli per i nodi che fanno parte del cluster Kubernetes
KubePodInventory Pod Kubernetes e relative proprietà
KubePVInventory Volumi persistenti Kubernetes e le relative proprietà.
KubeServices Servizi Kubernetes e relative proprietà
Heartbeat Record registrati dagli agenti di Log Analytics una volta al minuto per segnalare l'integrità dell'agente

Metriche del nesso degli operatori

La tabella "InsightMetrics" nella sezione Logs contiene le metriche raccolte da Bare Metal Machines e dal cluster Kubernetes undercloud. È anche possibile osservare alcune metriche selezionate raccolte dal sottocloud aprendo la scheda Metriche dal menu Monitoraggio di Azure.

Screenshot of Azure Monitor Metrics Selection.

Figura: Selezione delle metriche di Monitoraggio di Azure

Per informazioni dettagliate sull'uso di questo strumento, vedere Analizzare le metriche con Esplora metriche di Monitoraggio di Azure.

Workbooks

Le cartelle di lavoro combinano testo, query di log, metriche e parametri per l'analisi dei dati e la creazione di più tipi di visualizzazioni avanzate. È possibile usare i modelli di cartella di lavoro di Azure Resource Manager di esempio per Operator Nexus Logging and Monitoring per distribuire cartelle di lavoro di Azure all'interno della legge di Azure.

Avvisi

È possibile usare i modelli di avviso di Azure Resource Manager di esempio per le regole di avviso di Operator Nexus. È necessario specificare soglie e condizioni per gli avvisi. È quindi possibile distribuire questi modelli di avviso nell'ambiente locale.

Area di lavoro Log Analytics

Un'area di lavoro Log Analytics (LAW) è un ambiente univoco per registrare i dati da Monitoraggio di Azure e altri servizi di Azure. Ogni area di lavoro ha un proprio repository dati e una configurazione, ma può combinare i dati da più servizi. Ogni area di lavoro è costituita da più tabelle dati.

È possibile creare un'unica legge per raccogliere tutti i dati rilevanti o più aree di lavoro in base ai requisiti degli operatori.