Uw CycleCloud-productie-implementatie plannen

Azure CycleCloud-implementatie

Waarschuwing

Zorg ervoor dat hiërarchische naamruimte inschakelen voor Azure Data Lake Storage Gen 2 niet is ingesteld tijdens het maken van het opslagaccount. CycleCloud kan geen Blob-opslag gebruiken waarvoor ADLS Gen 2 is ingeschakeld als opslagkluis.

Azure CycleCloud-configuratie

Azure CycleCloud-clusterconfiguratie

  • Gebruikerstoegang tot het clustergebruikersbeheer definiëren
  • Bepalen welke planner wordt gebruikt
  • Bepalen welke SKU vereist is voor het scheduler/head-knooppunt
  • Bepaal welke SKU's nodig zijn voor de reken-/uitvoerknooppunten. Dit is volledig afhankelijk van de uitvoering van de toepassing
  • Worden clusters geïmplementeerd met behulp van een sjabloon of handmatig?
  • Moeten scripts worden uitgevoerd op de scheduler of worden knooppunten uitgevoerd zodra deze zijn geïmplementeerd:

Toepassingen

  • Welke afhankelijkheden (bibliotheken, enzovoort) hebben de toepassingen? Hoe worden deze beschikbaar gesteld?
  • Hoe lang duurt het voordat een toepassing is ingesteld en geïnstalleerd? Dit kan bepalen hoe een toepassing beschikbaar wordt gesteld voor de uitvoerknooppunten en kan een aangepaste installatiekopieën vereisen.
  • Moeten er licentieafhankelijkheden worden meegenomen? Moet de toepassing contact opnemen met een on-premises licentieserver?
  • Bepaal waar toepassingen vandaan worden uitgevoerd. Dit is afhankelijk van de installatietijden en prestatievereisten:
  • Is er een specifieke VM-SKU die moet worden gebruikt om de toepassingen uit te voeren? Is MPI een vereiste, omdat hiervoor een andere familie van machines zoals de H-serie nodig is?
  • Wat is het optimale aantal kernen per taak voor elke toepassing?
  • Kunnen spot-VM's worden gebruikt? Spot-VM's gebruiken in CycleCloud
  • Zorg ervoor dat abonnementsquota zijn ingesteld om te voldoen aan de kernvereisten voor de toepassingen

Gegevens

  • Bepaal in Azure waar de invoergegevens zich bevinden. Dit is afhankelijk van de prestaties van de toepassingen en de gegevensgrootte.
    • Lokaal op de uitvoerknooppunten
    • Vanuit een NFS-share
    • In blobopslag
    • Azure NetApp Files gebruiken
  • Bepalen of er naverwerking nodig is voor de uitvoergegevens
  • Bepalen waar de uitvoergegevens zich bevinden zodra de verwerking is voltooid
  • Moet het ergens anders worden gekopieerd?
  • Welke vereisten voor archiveren/back-ups zijn er?

Taak indienen

  • Hoe verzenden gebruikers taken?
  • Hebben ze een script dat moet worden uitgevoerd op de scheduler-VM of is er een front-end voor het uploaden van gegevens en het indienen van taken?

Back-up en herstel na noodgeval

  • Worden sjablonen gebruikt voor het maken van clusters? Hierdoor wordt de recreatie van een CycleCloud-server veel sneller en consistent in verschillende implementaties
  • Welke vereisten voor herstel na noodgevallen zijn er? Wat zou er met het bedrijf gebeuren als een Azure-regio niet beschikbaar was zoals verwacht?
  • Zijn er toepassings-SLA's gedefinieerd door het interne bedrijf?
  • Kan een andere regio worden gebruikt als stand-by?
  • Worden taken lang uitgevoerd? Zou controlepunten nuttig zijn?