Machine Learning マネージドエンドポイントの自動スケーリングについて

Question

Machine Learning マネージドエンドポイントの自動スケーリングについて

nakagawa 20

※本質問を投稿する際の「child tag」に「Azure SQL データベース」しか表示されなかったため、質問内容と異なりますが、「Azure SQL データベース」タグを選択しています。

【質問】

Azure Machine Learning マネージドエンドポイントの自動スケーリングについて、以下に質問させていただきます。

ご回答よろしくお願いします。

①自動スケーリングでマネージドエンドポイントが複数存在する場合、端末から受信したリクエストの負荷分散方式は何になりますか？（ラウンドロビン？）

②マネージドエンドポイントが使用するVMに対する「コア数」のクォータ上限値は、自動スケーリングの最大VM数分だけ設定しておく必要がありますか？

以上です。

0 件のコメント

質問作成者が受け入れた回答

0 件の追加の回答

お客様の回答

Answer 1

こんにちは nakagawa,

オートスケーリングを伴う複数の管理エンドポイントの負荷分散方法

Azure MLモデルエンドポイントでは、負荷分散は単一のエンドポイント内のデプロイメントレベルで管理されます。エンドポイント内では、複数のデプロイメント（モデルのバージョン）を作成し、トラフィックルールを使用してそれらの間でトラフィックを分配できます。トラフィックは特定の割合に基づいて割り当てることができます。

詳細については、こちらを参照してください。

オートスケーリングにおけるVMの最大コア数のクォータ設定

インスタンスを選択する必要があり、コアを選択する必要はありません。通常、インスタンスを選択すると、コアの数とコストが表示されます。

enter image description here

追加する必要があるのはインスタンスの数だけで、十分なクォータがあることを確認してください。

ここに記載されています

アップグレードを行うために、20%の追加計算リソースを確保します。たとえば、デプロイメントで10インスタンスを要求する場合、12のクォータを持っている必要があります。

ここでは12のインスタンスが必要で、選択したインスタンスが4コアの場合、48コアのクォータが必要です。

私は英語からの回答を翻訳していますので、文法的な問題があればお許しください。

nakagawa 20 評価のポイント

2025-02-20T12:25:09.7366667+00:00

回答ありがとうございます！

とても助かりました。

次の方法で共有

Machine Learning マネージド エンドポイントの自動スケーリングについて

0 件の追加の回答

お客様の回答

Machine Learning マネージドエンドポイントの自動スケーリングについて