Bewaking

Azure CycleCloud biedt ondersteuning voor het bewaken van externe services via de pluggable-architectuur. Beheerders kunnen automatische bewaking van deze systemen inschakelen naar de pagina Instellingen onder het gebruikersmenu in de rechterbovenhoek van de webinterface, dubbelklikken op het item CycleCloud-instellingen en het selectievakje Bewaking inschakelen voor CycleCloud-services inschakelen.

Wanneer deze optie is ingeschakeld, worden ondersteunde services in elk cluster automatisch geregistreerd bij CycleCloud, waarmee bewaking voor die service wordt geconfigureerd.

Ondersteunde services

Ganglia

Elke versie van CycleCloud wordt geleverd met ondersteuning voor Ganglia-bewaking voor het verzamelen van metrische prestatiegegevens, zoals cpu/geheugen/bandbreedtegebruik. Als uw cluster is geconfigureerd voor het gebruik van Ganglia (de standaardinstelling in de meeste gevallen), werkt automatische bewaking zolang poort 8652 is geopend tussen CycleCloud en het hoofdknooppunt van het cluster (het knooppunt waarop de gmetad-service wordt uitgevoerd).

Ganglia op CentOS/RHEL

Ganglia op CentOS en RHEL wordt geleverd door EPEL. Azure CycleCloud configureert en installeert standaard EPEL en de Ganglia-afhankelijkheden.

U kunt ervoor kiezen om EPEL te gebruiken door in te stellen cyclecloud.install_epel = false in een clustersjabloon. Als u zich afmeldt voor EPEL, wordt de installatie van Ganglia-bewaking overgeslagen. Dit heeft geen invloed op de rekenkundige functionaliteit van uw rekencluster, maar zal geen gegevens bevatten die zouden zijn verzameld voor de rapportenweergave van uw cluster.

Voor informatieve doeleinden zijn hier de 'client'-afhankelijkheden geïnstalleerd op het uitvoeren van clusterknooppunten en de 'server'-afhankelijkheden die zijn geïnstalleerd op hoofd-/hoofdclusterknooppunten.

# Ganglia client dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc pcre python python-libs systemd zlib

# Ganglia client dependencies provided by EPEL
yum -y install ganglia ganglia-gmond ganglia-gmond-python libconfuse

# Ganglia server dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc libmemcached pcre rrdtool systemd zlib

# Ganglia server dependencies provided by EPEL
yum -y install ganglia ganglia-gmetad libconfuse

Rasterengine

Als u de Grid Scheduling Edition van CycleCloud uitvoert, wordt de bewaking van grid-engine automatisch geconfigureerd wanneer een Grid Engine-cluster wordt gestart. De enige vereiste is dat CycleCloud SSH kan gebruiken voor het knooppunt waarop de qmaster-service wordt uitgevoerd met de keypair die is geconfigureerd voor het cluster.

Azure Monitor

Vanaf CycleCloud 8.0 worden metrische gegevens voor een cluster opgehaald uit Azure Monitor in plaats van Ganglia. Hierdoor hoeft poort 8652 niet meer te worden geopend op knooppunten.

Notitie

Zelfs clusters die nog op versie 7 staan en Ganglia vooraf hebben geïnstalleerd, krijgen hun metrische gegevens van Azure Monitor in CycleCloud 8.

De verzamelde metrische gegevens zijn:

  • Percentage CPU
  • Gelezen bytes op de schijf
  • Geschreven bytes op de schijf
  • Netwerk in
  • Netwerk uit

Het is ook mogelijk om logboekgegevens van CycleCloud-clusters op te slaan in Log Analytics en aangepaste dashboards voor metrische gegevens te maken. Zie de sectie Instructies en de zelfstudies in de Documentatie van Azure Monitor voor meer informatie over het maken van aangepaste dashboards voor metrische gegevens uit Log Analytics voor uw clusters.