Microsoft Graph データ接続についてよく寄せられる質問

Microsoft Graph データ接続を使用すると、開発者は、顧客が Microsoft Graph の膨大なデータセットへのマネージド アクセスを提供するために使用できるアプリケーションを開発できます。 この記事では、Microsoft Graph Data Connect 機能を活用するのに役立つヒントを提供します。 Microsoft Graph データ接続の概要については、「概要」を参照してください。

その他の質問については、「 トラブルシューティング」を参照するか、 Data Connect チームにお問い合わせください。

Microsoft Graph データ接続は適切な選択ですか?

Microsoft Graph Data Connect と Microsoft Graph API は、同じ基になるデータへのアクセスを提供しますが、非常に異なる方法でアクセスできます。 Microsoft Graph Data Connect は、大量のデータセットを一括で抽出し、organization全体にスケーラブルに抽出するように設計されていますが、Microsoft Graph API は、organization内の選択したユーザーやグループから少量のデータにアクセスするのに適しています。

たとえば、Microsoft Graph Data Connect を使用して、過去 1 年間のメール データの最初の抽出を行い、次に Microsoft Graph API を使用して電子メールをリアルタイムで分析することができます。 Microsoft Graph Data Connect と Microsoft Graph API は、ジョブごとに異なるツールです。 実現したいシナリオに最適なアクセス方法はどちらかを検討することが大切です。 詳細については、「Microsoft Graph API または Microsoft Graph Data Connect を使用するタイミング」を参照してください。

企業が Microsoft 365 データを使用するシナリオは何ですか?

Microsoft 365 データを利用できるユース ケースはいくつでも存在します。 顧客が関心を持つ一般的なシナリオを次に示します。

  • Customer Relationship Analytics: コマーシャル ビジネス リーダーの場合は、従来の CRM 分析情報を超えて、コミュニケーションとコラボレーション パターンに基づいて顧客の相互作用と関係を理解します。

  • Business Process Analytics: 運用を向上させるには、日々のorganizationを通じて実際に作業がどのように流れるかを参照してください。 自動化または最適化する必要がある手動のプロセスとワークフローのボトルネックを特定します。

  • セキュリティとコンプライアンス分析: 機密データをセキュリティで保護するには、従業員がどのように機密情報を使用して共有しているかを学習します。 異常検出、脅威インテリジェンス、監査ログ分析、リスク管理、法的フォレンジックを実装します。

  • People Productivity Analytics: 変革を促進するために、Vivaの生産性メトリックをエクスポートして、デジタル導入、スマート会議とコンテンツ、ハイブリッド ワークプレース、文化的変化を使用して分析情報をソリューションに変換できるようにします。

Viva Insightsと Microsoft Graph Data Connect の違い  

Viva Insightsと Microsoft Graph Data Connect は補完的です。 どちらも Microsoft 365 に依存していますが、Viva Insightsと Data Connect はさまざまな対象ユーザーとニーズに対応します。

お客様がViva Insights以外の分析情報と分析を求めている場合、Data Connect はカスタム要件を実現するための拡張性を提供します。 たとえば、Teams 呼び出しレコードとトランスクリプト、および現在Viva Insightsのスコープに含まれていない SharePoint Online データ セットが提供されます。 さらに、Data Connect 生データは、Viva Insightsから他の方法では使用できない詳細を提供します。

Microsoft Graph Data Connect の初期オーバーヘッドはありますか?

データ接続は大量のデータを一括して抽出するように設計されているため、データを抽出できるようになる前に、ある程度のオーバーヘッドが発生します。 このオーバーヘッドは約 45 分です。つまり、データ サイズに関わりなくすべてのパイプラインで、その程度の時間が最低必要になります。 最初のオーバーヘッドがユース ケースに長すぎる場合は、 Microsoft Graph Data Connect チームにお問い合わせください。

注:

テナント管理者は、パイプラインを開始してから 24 時間以内に承認と同意を行う必要があります。 24 時間以内に同意が与えられない場合、有効期限が切れ、パイプラインをもう一度開始して同意プロセスを再開する必要があります。 オーバーヘッド時間には、同意の承認にかかった時間は含まれません。

Microsoft Graph Data Connect はどのリージョンで利用できますか?

現在、Microsoft Graph Data Connect は、北米、ヨーロッパ、アジア太平洋、英国/英国、オーストラリアの複数のリージョンで利用できます。 その他のリージョンは、今後利用可能になる予定です。

Office から Azure へのリージョンとマッピングの一覧については、「 データセット、リージョン、シンク」を参照してください。

Microsoft Graph Data Connect で使用できるデータセットは何ですか?

次の種類のデータセットを使用できます。

  • 基本: 生のお客様が作成したコンテンツと、Microsoft 365 アプリケーションとサービスからの入力 (Microsoft Entra ID、Outlook、Teams データセットなど) から生成されたデータセット。 

  • クリーン済み: 基本的なデータセットからの正規化と重複除去によって生成されたデータセット、または Microsoft 365 のユーザー アクティビティまたは動作シグナル (SharePoint、Office 365 データセットなど) から作成されたデータセット。  

  • キュレーション: 特定のユース ケースまたは分析シナリオ用にカスタムで生成されたデータセット、または機能拡張のためにファースト パーティの Microsoft 365 分析アプリケーションのデータセット (Viva Insights メトリックなど)。

次の各データセットを複数使用できます。

  • Teams
  • Outlook
  • Microsoft Entra ID
  • OneDrive/Sharepoint
  • Viva Insights

新しいデータセットは、Microsoft Graph Data Connect に定期的に追加されます。 完全な一覧については、「 データセット、リージョン、シンク」を参照してください。

プレビュー段階のデータセットと一般公開されているデータセットはどれですか?

現在、OneDrive/SharePoint とViva Insightsのデータセットは、プレビュー段階のお客様、またはViva Insights ライセンスを持つユーザーに対して使用できます。

一般公開またはプレビューのみのデータセットについては、「 データセット、リージョン、シンク」を参照してください。

課金はどのように計算されますか?

Microsoft Graph Data Connect では、お客様に月単位で課金され、請求書の計算時に端数切り上げも行われます。 各パイプライン実行は個別に課金されます。

たとえば、顧客は月内に 20 個のパイプライン実行を行い、それぞれ 500 行を生成します。 合計で、顧客はその月に 10,000 行のパイプラインを実行します。 ただし、請求額は 10,000 行/1000 行 = 10 単位ではありません。

代わりに、Microsoft Graph Data Connect は分数を切り上げるため、顧客は 20 単位に対して課金されます。 500 行 /1000 行 = 0.5 および 0.5 は分数であるため、1 に切り上げられます。 顧客には、パイプライン実行ごとに 1 つのユニットが課金され、合計で 20 単位が課金されます。

テナントでデータセットがまだサポートされていない場合、どうすればよいですか?

OneDrive/SharePoint や Viva Insights などのデータセットの場合は、「データセット、リージョン、シンク」で説明されている条件を満たしていることを確認してください。 これらのデータセットは、明示的にオプトインした顧客のみが使用できます。

質問については、 Microsoft Graph Data Connect チームにお問い合わせください。

Microsoft Graph Data Connect が最適なシナリオは何ですか?

生産性ツールに提供される大規模なデータセットを活用できる組織は、直面する可能性のある課題と機会に関する多くの分析情報を入手できます。 お客様は、生産性の高い分析のためのorganization ネットワーク、セキュリティとコンプライアンス分析のための情報の共有過多、顧客関係分析の販売者関係の強みなど、複数のシナリオにわたってアプリケーションを構築します。

データが Microsoft Graph データ接続の組織のサブスクリプション内にとどまる可能性はありますか?

Microsoft Graph Data Connect は、要求されたデータセットを配信するときに、組織のテナント境界を尊重します。 Microsoft 365 データセットにアクセスするには、Azure リソースと Microsoft 365 サービスの両方が同じMicrosoft Entraテナント内に配置されている必要があります。 クロステナント データセット アクセスは現在使用できません。

Microsoft Graph データ接続にはサービス プリンシパルが必要ですか?

Azure Synapseまたは Data Factory パイプラインを作成するときは、Microsoft 365 のリンクされたサービスにサービス プリンシパルを指定する必要があります。 Azure では、サービス プリンシパルは、アプリケーションまたはサービス (つまり、ユーザーではない) を表すセキュリティ ID です。 Microsoft Graph データ接続は、Microsoft 365 データへの承認されたアクセスを取得する際に、その ID としてサービス プリンシパルを使用します。

他のユーザーが自分のテナントで使用できる Azure 管理対象アプリを作成する場合も、そのアプリが使用するサービス プリンシパルをアプリの発行元が提供します。 このサービス プリンシパルは、発行元のテナント内にあります。 ただし、アプリで他のサービス プリンシパルが必要になる場合は、インストールしたユーザーが自分のテナント内にサービス プリンシパルを作成します。 たとえば、Azure SynapseまたはAzure Data Factory パイプラインでは、Azure のストレージ リソースにアクセスする必要がある可能性があります。 お客様は、パイプラインが使用するストレージ アカウントへのアクセス許可を指定したサービス プリンシパルを作成します。

Azure SynapseまたはAzure Data Factoryを使用してアプリケーションをビルドする方法の詳細については、「Data Connect クイック スタート」を参照してください。

保留中の特権アクセス管理 (PAM) 要求をチェックするにはどうすればよいですか?

Microsoft Graph データ接続がデータをコピーできるようになるには、管理者が Privileged Access Management (PAM) 要求を許可する必要があります。 PAM は、Microsoft 365 でデータへのデータ パイプライン アクセスを承認するために使用されるメカニズムです。

初めてパイプラインをトリガーするときに、PAM は Microsoft 365 管理者 (または指定された代理人) がそのアクセス要求を承認するまで待機します。 パイプラインの状態は "処理中" と表示されますが、次のスクリーンショットに示すように、基になるコピー アクティビティは、承認がなされるまで ConsentPending の状態になります。

ConsentPending の状態であることを示すパイプライン実行状態ウィンドウのスクリーンショット

開発中、特にパイプラインを変更した後は、パイプラインの実行が ConsentPending で停止しないことを確認なさるようにお勧めします。 たとえば、スキーマに別のフィールドを追加すると、次にパイプラインを実行する時に、承認を必要とする新しい PAM 要求が発行されます。 承認を待機しているパイプラインの処理をただ待っていては、時間が無駄になってしまいます。

承認されていない場合、同意要求は 24 時間後に期限切れになり、パイプラインは失敗することに注意してください。 さらに、PAM の承認は 6 か月間のみ有効です (取り消されない限り)。

Microsoft 365 管理センターから PAM 要求を承認するにはどうすればよいですか?

PAM UX を使用して承認するには、Microsoft 365 管理センターの PAM インターフェイスに移動します。 この管理センターを使用すると、簡単でわかりやすい方法で PAM 要求を表示して、要求を承認、拒否、取り消すことができます。

要求を承認するには:

  • Microsoft Graph Data Connect を有効にする場合は、承認者のグループ内に存在する必要があります。
  • ユーザーにはグローバル 管理 ロールが必要です。
  • ユーザーには、Exchange Online ライセンスが割り当てられている必要があります。

PAM 要求を承認または拒否するには、次の手順を使用します。

  1. Microsoft 365 管理センターで PAM インターフェイスにサインインします。
  2. 右側のウィンドウで、[設定] [組織の>設定>] [サービス>][Microsoft Graph Data Connect] の順にクリックします。
  3. 要求を見つけます。
  4. 要求の詳細を確認します。
  5. 必要に応じて拒否リストスクラブを追加します。
  6. 要求を承認または拒否します。

詳細については、 Data Connect クイック スタートに関するページを参照してください。

抽出されるデータのスコープがデータセット、列、ユーザーなどに対して同じままである限り、パイプラインの実行によって新しい同意要求はトリガーされません。 代わりに、パイプラインは承認された同意を使用します。これは 6 か月間続きます。 異なる日付に対して同じスコープでパイプラインを実行しても、新しい同意もトリガーされません。

新しいデータセットの追加、列の追加、他のユーザーの追加など、データのスコープが変更された場合、新しい同意要求がトリガーされます。 また、Azure SynapseまたはAzure Data Factoryでパイプラインまたはアクティビティ名を変更するときに、新しい同意をトリガーすることもできます。

PAM 要求を承認するために 2 番目のユーザーが必要な理由

データセット パイプラインの実行を要求すると、Microsoft Graph Data Connect サービスによって検証が行われ、必要に応じて PAM 承認要求がトリガーされます。 要求は、Microsoft 管理 センターで Microsoft Graph Data Connect を有効にするときに、テナントに対して定義されている承認者グループに送信されます。

ただし、このアカウントが設定した承認者グループの一部である場合でも、自己承認が許可されていないため、PAM 要求を承認するために使用することはできません。 実行しようとすると、PAM ポータルに "要求元と承認者が同じです。 自己承認は許可されていません" というエラー メッセージが表示されます。

開発向けに、要求を承認する管理者に加えて、第 2 のアカウントを作成できます。 提出者と承認者の双方に、アクティブな Exchange Online アカウントが必要です。

必要に応じて重複するメールを削除することはできますか?

Message データセットからメールを抽出する際に、同じメールの JSON オブジェクトが複数存在することがよくあります。 このような重複は、メールが複数の宛先に送信された場合、各受信者のメールボックスにそのメールのコピーが存在することが原因です。 データセットは各メールボックスから抽出されるため、全ユーザーのコピーがすべて含まれることになります。 一部のシナリオではコピーをすべて保持する必要がありますが、そうでなければ、重複を削除できます。

エクスポートされた JSON オブジェクトの重複は、メッセージの internetMessageId に基づいて削除できます。同じ internetMessageId を持つ 2 つのメッセージは、同一インスタンスの重複するコピーです。 重複は異なる BLOB に存在することもあるので、BLOB ごとに重複を削除するのではなく、すべての BLOB を対象に重複を削除する必要があります。

puser フィールドを使用して関連するユーザーを特定することはできますか?

抽出したデータには、対応する Microsoft Graph API を使用する時点では存在しないメタ プロパティがいくつか含まれます。 特に puser フィールドは、データの抽出元ユーザーを特定するのに役立ちます。 同じメールのコピー 2 つが異なるメールボックスにあるシナリオでは、puser フィールドを使用することで、どちらのコピーがどのメールボックスから抽出されたかを特定できます。 puser フィールドは、Manager データセットなどのデータセットにも役立ちます。 エクスポートされた JSON にはマネージャーに関する情報が含まれますが、この情報が役立つのはそのマネージャーが誰のマネージャーであるかを知っている場合に限られます。 puser フィールドから、その JSON オブジェクトが一致するのは誰のマネージャーであるかを確認できます。

ハイブリッド モードのテナント設定はサポートされていますか?

Microsoft 365 のセットアップで Exchange Online に一部のユーザーがいて、Exchange オンプレミスに一部のユーザーがいる場合、Exchange オンプレミスにいるユーザーはサポートされません。 残念ながら、現在、Exchange オンプレミス ユーザー向けのデータ接続はサポートされていません。

リソース アカウントはサポートされていますか?

現在、リソース アカウントからのメッセージまたはイベントへのアクセスはサポートされていません。

ADF パイプラインの実行ごとに複数のファイルが表示され場合と、実行ごとに 1 つのファイルのみが表示される場合があるのはなぜですか?

Microsoft Graph データ接続は、パイプラインの実行ごとにユーザー リストを取得し、データセットの抽出とキュレーションを、並行して実行される複数のジョブに分散します。 並列実行ごとに、ユーザーが定義したデータ シンクに 1 つの出力ファイルが生成されます。 場合によっては、ユーザー リストが小さい場合、それらは 1 つの抽出およびキュレーション ジョブにマップされることがあり、その場合、データ シンクに生成される出力ファイルは 1 つだけです。