Azure Data Factory のコストを管理するための計画

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

この記事では、Azure Data Factory のコストを計画および管理する方法について説明します。

リソースをサービスに追加してコストを見積もる前に、まず、ETL プロジェクトの開始時に、Azure 料金計算ツールと、パイプラインごとの使用量および料金計算ツールを組み合わせて使用して、Azure Data Factory のコストを計画します。 次に、Azure リソースを追加するときに、推定コストを確認します。 Azure Data Factory リソースの使用を開始した後、コスト管理機能を使用して、予算を設定し、コストを監視します。 また、予想コストを確認し、支出の傾向を特定して、対処が必要な領域を特定することもできます。Azure Data Factory のコストは、Azure で課金される月額料金の一部でしかありません。 この記事で説明するのは、データ ファクトリのコストを計画および管理する方法のみです。 課金は、サードパーティのサービスを含め、ご使用の Azure サブスクリプションで使用されている Azure のすべてのサービスとリソースに対して行われます。

前提条件

Cost Management のコスト分析では、ほとんどの種類の Azure アカウントがサポートされますが、すべてではありません。 サポートされているアカウントの種類の完全な一覧については、「Understand Cost Management data (Cost Management データの概要)」を参照してください。 コスト データを表示するには、少なくとも Azure アカウントの読み取りアクセス許可が必要です。 Azure Cost Management データに対するアクセス権の割り当てについては、データへのアクセス許可の割り当てに関するページを参照してください。

Azure Data Factory を使用する前にコストを見積もる

ADF 料金計算ツールを使用して、Azure Data Factory で ETL ワークロードを実行するコストを見積もります。 計算ツールを使用するには、アクティビティの実行回数、データ統合の単位時間数、Data Flow に使用されるコンピューティングの種類、コア数、インスタンス数、実行期間などの詳細を入力する必要があります。

料金計算ツールについてよくある質問の 1 つが、どの値を入力として使用する必要があるかというものです。 概念実証フェーズでは、サンプル データセットを使用した試験を行って、さまざまな ADF メーターの使用量を把握できます。 続いて、サンプル データセットの使用量に基づいて、完全なデータセットおよび運用時スケジュールの使用量を算定できます。

Note

以下の例で使用されている価格は架空のものであり、実際の価格を暗に示すものではありません。

たとえば、毎日 1 TB のデータを AWS S3 から Azure Data Lake Gen2 に移動する必要があるとします。 100 GB のデータを移動して、データ インジェストのスループットを測定し、それに応じて課金される使用料金を測定するという概念実証を実行できます。

コピー アクティビティの実行の詳細のサンプルを次に示します (実際のマイレージは、特定のデータセットの形状、ネットワーク速度、S3 アカウントの送信制限、ADLS Gen2 の受信制限、その他の要因によって異なります)。

S3 copy run

パイプライン実行レベルでの使用量の監視を使用することで、対応するデータ移動メーター使用量を確認できます。

S3 copy pipeline consumption

そのため、1 日に 1 TB を移動するために必要な DIU 時間の 1 か月の合計は次のようになります。

1.2667 (DIU 時間数) * (1 TB / 100 GB) * 30 (1 か月の日数) = 380 DIU 時間

次に、30 回のアクティビティの実行と 380 DIU 時間を、ADF 料金計算ツールに入力し、月額の見積もりを得ることができます。

S3 copy pricing calculator

Azure Data Factory の詳細な課金モデルを理解する

Azure Data Factory は、新しいリソースをデプロイする際にコストが発生する Azure インフラストラクチャ上で実行されます。 その他のインフラストラクチャ コストが追加で発生する場合があることを理解しておくことが重要です。

Azure Data Factory に対する課金方法

Azure Data Factory は、クラウド規模用に構築されたサーバーレスのエラスティック データ統合サービスです。 ピーク時の負荷に対して計画する必要がある固定サイズのコンピューティングはありません。代わりに、必要に応じて操作ごとに割り当てるリソースの量を指定します。これにより、はるかにスケーラブルに ETL プロセスを設計できます。 さらに、ADF は使用量ベースのプランに対して課金されます。これは、使用した分だけを支払うことを意味します。

Azure Data Factory リソースを作成または使用すると、次の測定に基づいて課金される場合があります。

  • オーケストレーション アクティビティの実行 - アクティビティでオーケストレーションを実行する回数に基づいて課金されます。
  • データ統合単位 (DIU) 時間 - Azure Integration Runtime で実行されるコピー アクティビティについて、DIU 使用数と実行時間に基づいて課金されます。
  • 仮想コア時間 - データ フローの実行とデバッグについて、コンピューティングの種類、仮想コアの数、実行時間に基づいて課金されます。

請求期間終了時に、各測定の料金が合計されます。 請求書には、Azure Data Factory に対して発生したすべてのコストに関するセクションが表示されています。 測定ごとに個別の行項目があります。

Azure Data Factory で発生する可能性があるその他のコスト

Azure Data Factory (ADF) のリソースを作成すると、他の Azure サービスのリソースも作成されます。 これには次のようなものがあります。

  • パイプライン アクティビティの実行
  • 外部パイプライン アクティビティの実行
  • データ ファクトリ成果物の作成/編集/取得/監視
  • インスタンスの種類と期間に基づいた SSIS Integration Runtime (IR) の期間

注意

ADF とその他の Azure リソースに同じタグを割り当てて、それらを同じカテゴリにまとめ、統合された課金を表示できます。 ADF タグは、その中のすべての SSIS IR に継承されます。 ADF タグを変更する場合は、新しいタグを継承できるようにその中のすべての SSIS IR を停止して再起動する必要があります。SSIS IR の再構成に関するセクションを参照してください。

Azure Data Factory での Azure 前払いの使用

Azure Data Factory の料金は、Azure 前払いのクレジットで支払うことができます。 ただし、Azure 前払いのクレジットを使用して、サードパーティの製品やサービス (Azure Marketplace からのものを含む) の料金を支払うことはできません。

コストを監視する

Azure Data Factory のコストは、ファクトリ、パイプライン、パイプライン実行、アクティビティ実行の各レベルで監視できます。

コスト分析を使用してファクトリ レベルでコストを監視する

Data Factory で Azure リソースを使用する場合、コストが発生します。 Azure リソース使用のユニット コストは、期間 (秒、分、時間、日数) やユニット使用量 (バイト、メガバイトなど) によって異なります。Data Factory の使用が開始されるとすぐにコストが発生し、コスト分析でコストを確認できます。

コスト分析を使用すると、さまざまな期間について、Data Factory のコストをグラフや表で表示できます。 たとえば、日単位、現在の月、以前の月、年単位などがあります。 予算や予想コストを基準としてコストを表示することもできます。 時間経過を示す、より長い期間のビューに切り替えると、支出の傾向を特定するのに役立ちます。 超過出費が発生した可能性のある時期を確認できます。 予算を作成したら、それを超えた場所も簡単に確認できます。

コスト分析で Data Factory のコストを表示するには、次の手順を実行します。

  1. Azure portal にサインインします。
  2. Azure portal でスコープを開き、メニューから [コスト分析] を選択します。 たとえば、 [サブスクリプション] に移動し、一覧からサブスクリプションを選択して、メニューから [コスト分析] を選択します。 コスト分析で別のスコープに切り替えるには、 [スコープ] を選択します。
  3. 既定では、最初のドーナツ グラフにサービスのコストが表示されます。 グラフの [Azure Data Factory v2] というラベルが付いた領域を選択します。

最初にコスト分析を開いたときに、実際の月額コストが表示されます。 月単位のすべての使用コストを示す例を次に示します。

Example showing accumulated costs for a subscription

  • Data Factory などの 1 つのサービスのコストに絞り込むには、 [フィルターの追加] を選択してから、 [サービス名] を選択します。 次に、 [Azure Data Factory v2] を選択します。

Data Factory のみのコストを表示する例を次に示します。

Example showing accumulated costs for ServiceName

前の例では、サービスの現在のコストが表示されます。 Azure リージョン (場所) 別およびリソース グループ別の Data Factory のコストも表示されます。 ここでは、コストを自分で調べることができます。

コスト分析を使用してパイプライン レベルでコストを監視する

場合によっては、チャージバックの目的などで、ファクトリ内の運用コストの詳細な内訳が必要になることが考えられます。 Azure Billing のコスト分析プラットフォームを統合することで、Data Factory はパイプライン単位に課金料金を分離できます。 ファクトリに対して Azure Data Factory の詳細な請求レポートをオプトインすることで、前述のファクトリ内で各パイプラインにかかったコストをより正確に把握できます。

詳細な課金情報が必要なファクトリ "ごとに" オプトインする必要があります。 パイプライン単位の詳細な課金機能を有効にするには、次のようにします。

  1. Azure Data Factory ポータルに移動します
  2. [管理] タブの [全般] セクションで [Factory settings] (ファクトリ設定) を選択します
  3. [課金レポートを表示する (プレビュー)] の [パイプライン単位] を選択します
  4. 変更内容を発行します

Screenshot of steps to enable per pipeline billing feature.

Note

パイプラインの詳細な課金設定は、ファクトリからエクスポートされた ARM テンプレートには含まれ "ません"。 つまり、継続的インテグレーションおよびデリバリー (CI/CD) は、ファクトリの課金動作を上書きしません。 これにより、開発、テスト、運用の各ファクトリに対して異なる課金動作を設定できます。

機能が有効になると、各パイプラインに対して課金レポートに個別のエントリが表示されます。選択した時間間隔での各パイプラインの "正確な" コストが表示されます。 これにより、支出の傾向を特定し、過大な支出が発生した場合にそれを確認できます。

Screenshot of example showing granular cost for a pipeline.

コスト分析のグラフ作成ツールを使用すると、個々のパイプラインを除く、上記と同様のグラフと傾向線を表示できます。 また、ファクトリ名が課金レポートに含まれるため、ファクトリ名ごとに概要ビューを取得し、必要に応じて適切なフィルター処理を行うこともできます。

この変更は、今後の請求書の出力方法にのみ影響し、過去の料金は変更されません。 変更が課金レポートに入力されるまでしばらくお待ちください。通常、変更は 1 日以内に反映されます。

警告

課金ごとの設定を選択すると、ファクトリ内のパイプラインごとに 1 つのエントリが作成されます。 ファクトリに膨大な量のパイプラインがある場合は、請求レポートが大幅に長くなり複雑になる可能性があるため、特に注意してください。

制限事項

パイプライン単位の課金機能に関する既知の制限事項を次に示します。 次に挙げる課金メーターは、それを動作させるパイプライン下には記録されず、代わりにファクトリのフォールバック明細下に記録されます。

Azure Data Factory のパイプライン実行レベルで消費量を監視する

パイプラインを実行すると、パイプラインに含まれているアクティビティの種類、移動および変換するデータの量、変換の複雑さに応じて、異なる課金メーターが Azure Data Factory で動作します。

個々のパイプラインの実行に関するさまざまなメーターの使用量は、Azure Data Factory のユーザー エクスペリエンスで確認できます。 監視エクスペリエンスを開くには、Azure portal の [データ ファクトリ] ブレードで [監視と管理] タイルを選択します。 ADF UX を既に使用している場合は、左側のサイドバーにある [モニター] アイコンを選択します。 既定の監視ビューはパイプラインの実行の一覧です。

パイプライン名の横にある [消費] ボタンをクリックすると、パイプライン内のすべてのアクティビティに対して集計されたパイプライン実行の使用量を示すポップアップ ウィンドウが表示されます。

Pipeline run consumption

Pipeline consumption details

[パイプラインの実行使用量] ビューには、特定のパイプライン実行の ADF メーターごとに消費された量は表示されますが、課金される実際の料金は表示されません。課金される金額は、所有している Azure アカウントの種類と使用されている通貨の種類によって異なります。 サポートされているアカウントの種類の完全な一覧については、「Understand Cost Management data (Cost Management データの概要)」を参照してください。

Azure Data Factory のアクティビティ実行レベルで消費量を監視する

パイプライン実行レベルでの集計された使用量を把握した後、シナリオによっては、さらにドリルダウンして、パイプライン内で最もコストのかかるアクティビティを特定する必要があります。

アクティビティ実行レベルでの使用量を表示するには、データ ファクトリの [作成と監視] UI に移動します。 パイプライン実行の一覧が表示される [モニター] タブで、パイプライン名のリンクを選択して、パイプライン実行でのアクティビティの実行の一覧にアクセスします。 アクティビティ名の横にある [出力] ボタンを選択し、JSON 出力で billableDuration プロパティを探します。

コピー アクティビティの実行のサンプルを次に示します。

Copy output

マッピング データ フロー アクティビティの実行のサンプルを次に示します。

Dataflow output

予算を作成する

予算を作成して、コストを管理し、異常な支出や浪費のリスクについて、関係者に自動的に通知するアラートを作成できます。 アラートは、予算とコストのしきい値と比較した支出に基づきます。 予算とアラートは、Azure サブスクリプションとリソース グループに対して作成されるため、全体的なコスト監視戦略の一環として役立ちます。

監視の粒度をさらに細かく示す必要がある場合は、Azure の特定のリソースまたはサービスに対するフィルターを使用して予算を作成できます。 フィルターを使用すると、追加のコストがかかる新しいリソースが誤って作成されないようにすることができます。 予算を作成するときに使用可能なフィルター オプションの詳細については、グループとフィルターのオプションに関する記事を参照してください。

コスト データのエクスポート

また、ストレージ アカウントにコスト データをエクスポートすることもできます。 これは、自分や他のユーザーがコストに関する他のデータ分析を行う必要があるときに便利です。 たとえば、財務チームは、Excel や Power BI を使用してデータを分析できます。 日単位、週単位、または月単位のスケジュールでコストをエクスポートし、カスタムの日付範囲を設定することができます。 コスト データのエクスポートは、推奨されるコスト データセット取得方法です。