次の方法で共有

Machine Learning マネージド エンドポイントの自動スケーリングについて

nakagawa 20 評価のポイント
2025-02-20T05:19:15.9833333+00:00

※本質問を投稿する際の「child tag」に「Azure SQL データベース」しか表示されなかったため、質問内容と異なりますが、「Azure SQL データベース」タグを選択しています。

【質問】

Azure Machine Learning マネージド エンドポイントの自動スケーリングについて、以下に質問させていただきます。

ご回答よろしくお願いします。

①自動スケーリングでマネージド エンドポイントが複数存在する場合、端末から受信したリクエストの負荷分散方式は何になりますか?(ラウンドロビン?)

②マネージド エンドポイントが使用するVMに対する「コア数」のクォータ上限値は、自動スケーリングの最大VM数分だけ設定しておく必要がありますか?

以上です。

コミュニティ センター | 監視されない
0 件のコメント コメントはありません

質問作成者が受け入れた回答

JAYA SHANKAR G S 4,195 評価のポイント Microsoft 外部スタッフ モデレーター
2025-02-20T09:52:29.0366667+00:00

こんにちは nakagawa,

  1. オートスケーリングを伴う複数の管理エンドポイントの負荷分散方法

Azure MLモデルエンドポイントでは、負荷分散は単一のエンドポイント内のデプロイメントレベルで管理されます。エンドポイント内では、複数のデプロイメント(モデルのバージョン)を作成し、トラフィックルールを使用してそれらの間でトラフィックを分配できます。トラフィックは特定の割合に基づいて割り当てることができます。

詳細については、こちらを参照してください。

  1. オートスケーリングにおけるVMの最大コア数のクォータ設定

インスタンスを選択する必要があり、コアを選択する必要はありません。通常、インスタンスを選択すると、コアの数とコストが表示されます。

enter image description here

追加する必要があるのはインスタンスの数だけで、十分なクォータがあることを確認してください。

ここに記載されています

アップグレードを行うために、20%の追加計算リソースを確保します。たとえば、デプロイメントで10インスタンスを要求する場合、12のクォータを持っている必要があります。

ここでは12のインスタンスが必要で、選択したインスタンスが4コアの場合、48コアのクォータが必要です。

私は英語からの回答を翻訳していますので、文法的な問題があればお許しください。

この回答は役に立ちましたか?

1 人がこの回答が役に立ったと思いました。

0 件の追加の回答

並べ替え方法: 最も役に立つ

お客様の回答

質問作成者は回答に "承認済み"、モデレーターは "おすすめ" とマークできます。これにより、ユーザーは作成者の問題が回答によって解決したことを把握できます。