CycleCloud の運用環境のデプロイを計画する
Azure CycleCloud のデプロイ
- デプロイする CycleCloud のバージョンを決定します。
- CycleCloud サーバーのデプロイに使用するサブスクリプション、vNet、サブネット、リソース グループを定義して、Azure サブスクリプションを準備する
- クラスターをホストする リソース グループ を定義するか、CycleCloud でクラスターを作成する必要があるかどうかを定義します (既定の設定)
- ロッカーアクセス用のストレージ アカウントを作成する
- 認証に SSH キー、AD、または LDAP を使用するかどうかを決定する
- CycleCloud でサービス プリンシパルまたはマネージド ID (1 つのサブスクリプションで推奨) を使用するかどうかを決定する(サービス プリンシパルとマネージド ID のどちらを選択するか)
- CycleCloud に使用される SKU を確認する: CycleCloud システム要件
- 環境はロックダウンされたネットワークにデプロイされますか? その場合は、次の要件を考慮 してください。
- CycleCloud サーバーをデプロイする
警告
ストレージ アカウントの作成時に、Azure Data Lake Storage Gen 2 の "階層型名前空間を有効にする" が設定されていないことを確認します。 CycleCloud では、ADLS Gen 2 がストレージ ロッカーとして有効になっている BLOB ストレージを使用できません。
Azure CycleCloud の構成
- CycleCloud サーバーにログインし、サイトと CycleCloud 管理者アカウントを作成します: CycleCloud セットアップ
- ストレージ アカウントを指す CycleCloud ロッカーを作成する
Azure CycleCloud クラスターの構成
- クラスター クラスター ユーザー管理へのユーザー アクセスを定義する
- 使用するスケジューラを決定する
- スケジューラ/ヘッド ノードに必要な SKU を決定する
- コンピューティング/実行ノードに必要な SKU を決定します。 これは、実行されているアプリケーションに完全に依存します
- クラスターはテンプレートを使用してデプロイするか、手動でデプロイしますか?
- クラスター テンプレートを定義し、ロッカーにアップロードする必要があります: クラスター テンプレート リファレンス
- 手動作成: 新しいクラスターを作成する
- スクリプトは、スケジューラで実行するか、デプロイ後にノードを実行する必要があります。
アプリケーション
- アプリケーションにはどのような依存関係 (ライブラリなど) がありますか? これらはどのように利用可能になりますか?
- アプリケーションのセットアップとインストールにはどのくらいの時間がかかりますか? これにより、アプリケーションを実行ノードで使用できるようにする方法が決まります。また、カスタム イメージが必要になる可能性があります。
- 考慮する必要があるライセンスの依存関係はありますか? アプリケーションはオンプレミスのライセンス サーバーに接続する必要がありますか?
- アプリケーションの実行元を決定します。これはインストール時間とパフォーマンス要件によって異なります。
- カスタム イメージを使用する場合:
- マーケットプレース イメージの使用
- NFS 共有、BLOB ストレージ、Azure NetApp Files から
- アプリケーションを実行するために使用する必要がある特定の VM SKU はありますか。 MPI は、H シリーズのような別のマシン ファミリを必要とするので、要件になりますか?
- 各アプリケーションのジョブあたりの最適なコア数は何ですか?
- スポット VM を使用できますか? CycleCloud でのスポット VM の使用
- アプリケーションのコア要件を満たすために サブスクリプション クォータ が設定されていることを確認する
Data
- Azure のどこに入力データが存在するかを決定します。 これは、アプリケーションのパフォーマンスとデータ サイズによって異なります。
- 実行ノードでローカルに
- NFS 共有から
- BLOB ストレージ内
- Azure NetApp Files の使用
- 出力データに後処理が必要かどうかを判断する
- 処理が完了した後に出力データが存在する場所を決定する
- 他の場所にコピーする必要がありますか?
- アーカイブ/バックアップの要件は何ですか?
ジョブの送信
- ユーザーはどのようにジョブを送信しますか?
- スケジューラ VM で実行するスクリプトがあるか、データのアップロードとジョブの送信に役立つフロントエンドがあるか。
バックアップと障害復旧
- テンプレートはクラスターの作成に使用されますか? これにより、CycleCloud サーバーの再作成がデプロイ全体で大幅に迅速かつ一貫したものになります。
- ディザスター リカバリーにはどのような要件がありますか? Azure リージョンが想定どおりに利用できなかった場合、ビジネスはどうなるでしょうか。
- 内部ビジネスによって定義されたアプリケーション SLA はありますか。
- 別のリージョンをスタンバイとして使用できますか?
- ジョブの実行時間は長いですか? チェックポイント処理は有益でしょうか。