次の方法で共有


Azure CycleCloud とは

Azure CycleCloud は、Azure 上のハイ パフォーマンス コンピューティング (HPC) 環境を調整および管理するためのエンタープライズ向けツールです。 CycleCloud を使用すると、ユーザーは HPC システム用のインフラストラクチャをプロビジョニングし、使い慣れた HPC スケジューラをデプロイし、インフラストラクチャを自動的にスケーリングして、任意の規模でジョブを効率的に実行できます。 CycleCloud を使用すると、ユーザーはさまざまな種類のファイル システムを作成し、HPC ワークロードをサポートするためにコンピューティング クラスター ノードにマウントできます。

Azure CycleCloud は、特定のスケジューラを使用して HPC 環境を設定する HPC 管理者とユーザーを対象としています。 Slurm、PBSPro、LSF、グリッド エンジン、HT-Condor などの一般的なスケジューラをサポートしています。 CycleCloud は、 Azure Batch の姉妹製品であり、Azure 上のサービスとしての Scheduler を提供します。

CycleCloud と他の Azure HPC ソリューションとの比較については、 Azure 上のハイ パフォーマンス コンピューティング (HPC) に関するページを参照してください。

Azure CycleCloud を使用する必要がある理由

長年の HPC 環境を持つ組織は、多くの場合、特定のスケジューラに関する深い専門知識とカスタム ツールを構築します。 Azure でこれらのセットアップを移動または再設計すると、圧倒的な影響を受けます。 CycleCloud は、仮想マシン (VM)、スケールセット、ネットワーク インターフェイス、ディスクなどの基本的な Azure 構成要素を抽象化するため、HPC 管理者は、ノードと構成可能なスケジューラで構成される HPC クラスターという使い慣れたクラスターに集中できます。

CycleCloud では、サポートされているスケジューラに自動スケール プラグインが追加されます。 つまり、ユーザーは複雑な自動スケール ルーチンを作成する必要がなく、既に知っているスケジューラ設定を操作するだけです。

豊富な宣言型テンプレート形式の CycleCloud は、Azure 上に完全な HPC 環境を構築するための強力なツールを提供します。 ユーザーは、NFS サーバー、並列ファイル システム、ログイン ホスト、ライセンス サーバー、およびディレクトリ サービスを含む環境をデプロイできます。基本的には、HPC システムで必要なすべてのコンポーネントを 1 つの管理プレーン経由で展開できます。

CycleCloud は、Azure MonitorAzure Cost Management ツールなどの Azure サービスと統合されます。

概要紹介

CycleCloud の機能

能力 画像
スケジューラーに依存しない
Slurm、PBS Pro、LSF、Grid Engine、HTCondor などの標準的な HPC スケジューラを使用するか、CycleCloud 自動スケール プラグインを拡張して独自のスケジューラを操作する
Schedulers のサンプル
コンピューティング リソースの管理
仮想マシンとスケール セットを管理して、動的ワークロードの要件を満たすことができる柔軟なコンピューティング リソースのセットを提供する
コンピューティング リソースのサンプル
リソースの自動スケーリング
ジョブの負荷、可用性、および時間の要件に基づいてクラスターのサイズとコンポーネントを自動的に調整する
自動スケーリングのサンプル
監視と分析
視覚化ツールを使用してパフォーマンス データを収集および分析する
サンプルの監視
テンプレート クラスター
CycleCloud テンプレートを使用してクラスター トポロジをコミュニティと共有する
テンプレート のサンプル
機能のカスタマイズと拡張
包括的な RESTful API を使用して、機能のカスタマイズと拡張、独自のスケジューラのデプロイ、既存のワークロード マネージャーのサポートを行います。
REST サンプル
既存のワークフローに統合する
組み込みの CLI を使用して既存のワークフローとツールに統合する
CLI サンプル
能力 画像
スケジューラーに依存しない
Slurm、PBS Pro、LSF、Grid Engine、HTCondor などの標準的な HPC スケジューラを使用するか、CycleCloud 自動スケール プラグインを拡張して独自のスケジューラを操作する
Schedulers のサンプル
コンピューティング リソースの管理
仮想マシンとスケール セットを管理して、動的ワークロードの要件を満たすことができる柔軟なコンピューティング リソースのセットを提供する
コンピューティング リソースのサンプル
リソースの自動スケーリング
ジョブの負荷、可用性、および時間の要件に基づいてクラスターのサイズとコンポーネントを自動的に調整する
自動スケーリングのサンプル
監視と分析
視覚化ツールを使用してパフォーマンス データを収集および分析する
サンプルの監視
テンプレート クラスター
CycleCloud テンプレートを使用してクラスター トポロジをコミュニティと共有する
テンプレート のサンプル
機能のカスタマイズと拡張
包括的な RESTful API を使用して、機能のカスタマイズと拡張、独自のスケジューラのデプロイ、既存のワークロード マネージャーのサポートを行います。
REST サンプル
既存のワークフローに統合する
組み込みの CLI を使用して既存のワークフローとツールに統合する
CLI サンプル

Azure CycleCloud を使用する方法

Azure CycleCloud は、オンプレミスまたは Azure VM で実行できるインストール可能な Web アプリケーションです。 インストール後、準備済みの Azure サブスクリプションでコンピューティング リソースとデータ リソースを使用するように CycleCloud を構成できます。 CycleCloud には、スケジューラ (PBSPro、LSF、Grid Engine、Slurm、HTCondor)、およびファイルシステム (NFS、BeeGFS) 用の公式クラスター テンプレートが多数用意されています。 CycleCloud コミュニティによって提供されるクラスター テンプレートも利用できます。 これらのクラスター テンプレートは、変更されていない状態で使用することも、特定のニーズに合わせてカスタマイズすることもできます。

クラスターが作成されると、スケジューラに送信された計算ジョブを処理するように、既定で自動スケーリングするように自動的に構成されます。 CycleCloud 管理機能は、組織内の他のユーザーの CycleCloud クラスターへのアクセスを制御します。

テンプレートと構成スクリプトを使用したツールを使用すると、複雑な HPC 環境をすばやく構築し、組織全体のさまざまなチームに対してこれらのセットアップをレプリケートできます。

CycleCloud とは何ではないか?

CycleCloud にはジョブ スケジュール機能はありません。 言い換えると、CycleCloud はスケジューラではなく、ユーザーが独自のスケジューラを Azure にデプロイできるプラットフォームです。 CycleCloud には、一般的に使用されるスケジューラ (PBSPro、Slurm、IBM LSF、Grid Engine、HTCondor) が組み込まれていますが、CycleCloud ユーザーは、提供されている自動スケール API の上に独自のスケジューラを頻繁に実装します。

CycleCloud では、特定のクラスター トポロジにロックされません。 Azure で HPC システムをすばやく起動するのに役立つテンプレートが含まれており、ニーズに合わせてこれらのテンプレートをカスタマイズできます。 Azure HPC コミュニティには、さまざまな種類のワークロードや業界向けに最適化された、意見に即したテンプレートが用意されています。

CycleCloud でデプロイされた環境の外観

CycleCloud のデプロイ

CycleCloud HPC システム全体を Azure インフラストラクチャにデプロイできます。 CycleCloud 自体は、Azure リソース プロバイダー API への送信アクセスを必要とする Azure 内の VM にアプリケーション サーバーとしてインストールされます。 CycleCloud は、HPC システムを構成する VM を起動して管理します。 これには通常、スケジューラ ヘッド ノードとコンピューティング ノードが含まれます。 また、ニーズに応じて、NFS サーバー、BeeGFS クラスター、ログイン ノード、要塞ホストなどの他のコンポーネントを追加することもできます。 完全なセットアップは CycleCloud テンプレートで定義されています。 NetApp Files、HPC Cache、Microsoft Entra ID Services などの Azure サービスに接続することもできます。

次のステップ