Uw CycleCloud-productie-implementatie plannen

Artikel
06/21/2023

Azure CycleCloud-implementatie

Bepaal welke versie van CycleCloud wordt geïmplementeerd:
- Azure CycleCloud 8.2 - Huidige release
- Azure CycleCloud 7.9 - Vorige release
Uw Azure-abonnement voorbereiden door te definiëren welk abonnement, vNet, subnet en resourcegroep moeten worden geïmplementeerd voor de CycleCloud-serverimplementatie
Definiëren welke resourcegroep clusters host of als CycleCloud deze moet maken (standaardinstelling)
Een opslagaccount maken voor toegang tot locker
Bepalen of SSH-sleutels, AD of LDAP worden gebruikt voor verificatie
Bepalen of CycleCloud een service-principal of een beheerde identiteit gebruikt (aanbevolen met één abonnement) kiezen tussen een service-principal en een beheerde identiteit
Controleer welke SKU wordt gebruikt voor CycleCloud: Systeemvereisten voor CycleCloud
Wordt de omgeving geïmplementeerd in een vergrendeld netwerk? Als dit het gevolg is, moet u rekening houden met de volgende vereisten: Werken in een vergrendeld netwerk
De CycleCloud-server implementeren

Waarschuwing

Zorg ervoor dat hiërarchische naamruimte inschakelen voor Azure Data Lake Storage Gen 2 niet is ingesteld tijdens het maken van het opslagaccount. CycleCloud kan geen Blob-opslag gebruiken waarvoor ADLS Gen 2 is ingeschakeld als opslagkluis.

Azure CycleCloud-configuratie

Meld u aan bij de CycleCloud-server, maak een site en een CycleCloud-beheerdersaccount: CycleCloud Setup
CycleCloud-locker maken die verwijst naar het opslagaccount

Azure CycleCloud-clusterconfiguratie

Gebruikerstoegang tot het clustergebruikersbeheer definiëren
Bepalen welke planner wordt gebruikt
Bepalen welke SKU vereist is voor het scheduler/head-knooppunt
Bepaal welke SKU's nodig zijn voor de reken-/uitvoerknooppunten. Dit is volledig afhankelijk van de uitvoering van de toepassing
Worden clusters geïmplementeerd met behulp van een sjabloon of handmatig?
- Clustersjablonen moeten worden gedefinieerd en geüpload naar het locker: Clustersjabloonreferentie
- Handmatig maken: een nieuw cluster maken
Moeten scripts worden uitgevoerd op de scheduler of worden knooppunten uitgevoerd zodra deze zijn geïmplementeerd:
- Cluster-Init
- Cloud-Init

Toepassingen

Welke afhankelijkheden (bibliotheken, enzovoort) hebben de toepassingen? Hoe worden deze beschikbaar gesteld?
Hoe lang duurt het voordat een toepassing is ingesteld en geïnstalleerd? Dit kan bepalen hoe een toepassing beschikbaar wordt gesteld voor de uitvoerknooppunten en kan een aangepaste installatiekopieën vereisen.
Moeten er licentieafhankelijkheden worden meegenomen? Moet de toepassing contact opnemen met een on-premises licentieserver?
Bepaal waar toepassingen vandaan worden uitgevoerd. Dit is afhankelijk van de installatietijden en prestatievereisten:
- Via een aangepaste installatiekopieën:
  - Aangepaste installatiekopieën in een CycleCloud-cluster
  - Een Linux-installatiekopieën voor klanten maken
- Een Marketplace-installatiekopieën gebruiken
- Vanuit een NFS-share, blobopslag, Azure NetApp Files
Is er een specifieke VM-SKU die moet worden gebruikt om de toepassingen uit te voeren? Is MPI een vereiste, omdat hiervoor een andere familie van machines zoals de H-serie nodig is?
- Azure VM-grootten - HPC
- Best practices voor HB/HC-clusters
Wat is het optimale aantal kernen per taak voor elke toepassing?
Kunnen spot-VM's worden gebruikt? Spot-VM's gebruiken in CycleCloud
Zorg ervoor dat abonnementsquota zijn ingesteld om te voldoen aan de kernvereisten voor de toepassingen

Gegevens

Bepaal in Azure waar de invoergegevens zich bevinden. Dit is afhankelijk van de prestaties van de toepassingen en de gegevensgrootte.
- Lokaal op de uitvoerknooppunten
- Vanuit een NFS-share
- In blobopslag
- Azure NetApp Files gebruiken
Bepalen of er naverwerking nodig is voor de uitvoergegevens
Bepalen waar de uitvoergegevens zich bevinden zodra de verwerking is voltooid
Moet het ergens anders worden gekopieerd?
Welke vereisten voor archiveren/back-ups zijn er?

Taak indienen

Hoe verzenden gebruikers taken?
Hebben ze een script dat moet worden uitgevoerd op de scheduler-VM of is er een front-end voor het uploaden van gegevens en het indienen van taken?

Back-up en herstel na noodgeval

Worden sjablonen gebruikt voor het maken van clusters? Hierdoor wordt de recreatie van een CycleCloud-server veel sneller en consistent in verschillende implementaties
Welke vereisten voor herstel na noodgevallen zijn er? Wat zou er met het bedrijf gebeuren als een Azure-regio niet beschikbaar was zoals verwacht?
Zijn er toepassings-SLA's gedefinieerd door het interne bedrijf?
Kan een andere regio worden gebruikt als stand-by?
Worden taken lang uitgevoerd? Zou controlepunten nuttig zijn?