Microsoft Purview eDiscoveryでの収集統計とレポート (Premium)

コレクションの見積もりを作成した後、検索条件に一致したほとんどの項目を含むコンテンツの場所や、検索クエリによって返されたアイテムの数など、取得したアイテムの統計情報を表示できます。 結果のサブセットをプレビューすることもできます。

さらに調べるドキュメントのセットを特定したら、検索結果をレビュー セットに追加して収集および処理できます。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

収集見積もりの統計を検索する

このセクションでは、収集見積もりに使用できる統計について説明します。 これらの統計は、コレクション見積もりのポップアップ ページの [ 統計の検索 ] タブで使用できます。

コレクションの見積もり

このセクションでは、コレクションから返された推定項目の概要をグラフィカルに表示します。 これは、コレクションの検索条件に一致する項目の数を示します。 この情報は、コレクションから返される推定項目数に関する情報を提供します。

  • 場所別の推定アイテム: コレクションによって返される推定アイテムの合計数。 メールボックス内およびサイト内にあるアイテムの特定の数も表示されます。
  • ヒットした推定場所: コレクションから返されるアイテムを含むコンテンツの場所の合計数。 メールボックスとサイトの場所の特定の数も表示されます。
  • 場所別のデータ ボリューム (MB 単位): コレクションによって返されるすべての推定項目の合計サイズ。 メールボックス アイテムとサイト アイテムの特定のサイズも表示されます。

コレクション見積もりの [コレクション見積もり] セクション。

条件レポート

このセクションでは、コレクション検索クエリに関する統計情報と、検索クエリのさまざまな部分に一致した推定項目の数を表示します。 これらの統計を使用して、検索クエリの各コンポーネントに一致する項目の数を分析できます。 これにより、コレクションの検索条件を絞り込み、必要に応じてコレクションのスコープを絞り込むことができます。

  • 場所の種類: クエリ統計が適用されるコンテンツの場所の種類。 Exchange の値はメールボックスの場所を示します。SharePoint の値はサイトの場所を示します。
  • パート: 統計が適用される検索クエリの部分。 Primary は、検索クエリ全体を示します。 Keyword は、行内の統計が特定のキーワードの統計用であることを示します。 コレクション内の検索クエリの場合にキーワード (keyword)リストを使用する場合、クエリの各コンポーネントの統計がこの表に含まれます。
  • 条件: 対応する行に表示される統計を返したコレクション見積もりに対して実行された検索クエリの実際のコンポーネント (キーワード (keyword)または条件)。
  • ヒットした場所: [条件] 列に一覧表示されているプライマリクエリまたはキーワード (keyword)クエリに一致するアイテムを含むコンテンツの場所の数 ([場所の種類] 列で指定されます)。
  • [アイテム]: [条件] 列に一覧表示されているクエリに一致する (指定されたコンテンツの場所からの) 項目の数。 前に説明したように、検索対象のキーワード (keyword)の複数のインスタンスがアイテムに含まれている場合、この列には 1 回だけカウントされます。
  • サイズ (MB):[条件] 列の検索クエリに一致する (指定されたコンテンツの場所で) 見つかったすべてのアイテムの合計サイズ。

コレクション見積もりの条件レポート セクション。

上位の場所

このセクションでは、コレクションから返されるほとんどの項目を含む特定のコンテンツの場所に関する統計情報を表示します。

  • 場所: 場所の名前 (メールボックスのメール アドレスとサイトの URL)。
  • 場所の種類: メールボックスには Exchange の種類があり、SharePoint サイトには SharePoint の種類があります。
  • アイテム: コレクションから返されるコンテンツの場所内のアイテムの推定数。
  • サイズ: 各コンテンツの場所にある推定アイテムの合計サイズ。

コレクション見積もりの上位の場所セクション。

コミットされたコレクションの統計とレポート

このセクションでは、レビュー セットに追加されたアイテムの実際の数など、コレクションをレビュー セットにコミットした後に使用できる統計について説明します。 これらの統計 (読み込みセット情報に加えて) は、ケースに追加されたコンテンツに関する履歴情報を提供します。

コレクションをレビュー セットにコミットすると、コミットされた接続のポップアップ ページに次のタブが表示されます。 これらの各タブには、コレクションに関するさまざまな種類の情報が含まれています。

コミットされたコレクションのポップアップ ページのタブ。

コレクションの [概要] タブ

コミットされたコレクションの [ 概要 ] タブには、コレクションアイテム、アイテムの見積もりと場所、インデックス作成、ファイルの種類などの情報を提供するいくつかのセクションが含まれています。

コレクションの概要 (プレビュー)

コミットされたレビュー セットの [概要] タブの [コレクションの概要] セクションには、コレクションの一部としてアイテムがどのように見つかり、取得され、処理されたかに関する情報が含まれています。 このセクションの情報は、最初の収集見積もり時に収集および表示される情報の概要であり、収集コミット時に収集および処理された情報がレビュー セットに含まれます。 このセクションの情報を使用すると、収集コミットと処理中に推定データから最終的な収集データがどのように進化するかについての理解を深めることができます。

この情報はセグメント化され、次のサブセクションに表示されます。

  • ヒットがある場所: このセクションでは、検索された場所の数と、コレクションの見積もりで定義された条件に基づいてヒットした場所の数を要約します。 検索された場所の数と種類も表示されます。

    ヒットした場所。

  • コレクション前の見積もり: このセクションでは、コレクションの見積もり (コレクションがコミットされる前) に計算された項目の数と合計項目のサイズを要約します。 部分的にインデックスが作成された項目の数も表示されます。

    コレクション前の見積もり。

  • コレクションアイテム: このセクションでは、コレクションのコミット時にヒットした場所からレビュー セットに取得されたすべてのアイテムの種類、カウント、および説明を表示します。 このプロセス中に、処理中に項目の追加と統合が行われる場合があります。 追加と統合には、次の表に含まれる型が含まれる場合があります。

    アイテムの種類 アイテムの種類の説明
    ヒットしたアイテム 検索で見つかったアイテムの推定数。
    セットの重複を確認する 既に同じレビュー セット内にあるアイテムは収集されません。
    重複を検索する 同じ項目の重複するインスタンスは収集されません。
    すべてのバージョン SharePoint 内のすべてのバージョンのアイテムが収集されます。
    履歴バージョン SharePoint によって管理されている履歴バージョンが収集されます。
    クラウド添付ファイル クラウドの添付ファイルは、SharePoint リンクから識別および収集されます。
    共有としてのバージョン アイテムの共有バージョンは、最新バージョンに加えて収集されます。
    コンテキスト Teams の会話 関連する可能性がある追加のチャット メッセージが収集されます。
    統合されたチャットトランスクリプト 収集されたチャット メッセージは、より少ない HTML トランスクリプトに統合されます。
    例外の取得 アクセス タイムアウト、空のファイル、およびその他の例外。
    収集されたアイテムの合計 さまざまな場所から収集されたアイテムの合計数。
  • レビュー セットの処理: このセクションには、コレクション見積もりからレビュー セットに追加されたアイテムの種類、カウント、および説明が表示されます。 アイテムは圧縮解除され、テキストがスキャンされ、インデックスが再作成され、レビューの準備として処理されます。

    レビュー セットの処理。

コレクションの内容

コミットされたレビュー セットの [概要] タブの [コレクションの内容] セクションには、コレクション内のデータ ソースから収集され、レビュー セットに追加されたアイテムに関する統計情報とその他の情報が含まれています。

  • 抽出された項目の合計数。 レビュー セットに追加されたアイテムの合計数。 この数値は、レビュー セットに追加された親アイテムと子アイテムの合計を示します。

    ヒント

    親または子項目のバーの上にカーソルを合わせると、親または子項目の合計数が表示されます。

  • 親項目。 レビュー セットに追加された項目を収集するために使用されたコレクションによって返される項目の数。 この数値は、[ コレクション パラメーター ] セクションに表示されるアイテムの推定数に対応します (および と等しくなります)。 レビュー セットに追加されたアイテムの収集に使用された情報を収集する親アイテムの数。

    親項目には、複数の子項目が含まれている場合があります。 たとえば、電子メール メッセージは、添付ファイルが含まれている場合、またはクラウドの添付ファイルがある場合、親アイテムです。 この場合、添付ファイルまたはクラウド添付ファイルのターゲット ファイルは子項目と見なされます。 コレクションをコミットすると、親アイテムとそれに対応する子項目 (添付ファイルやクラウド添付ファイルなど) がレビュー セットに個々のアイテムまたはファイルとして追加されます。

  • 子項目。 レビュー セットに追加された子項目の数。 個々のファイルとしてレビュー セットに追加されるのは、ファイルの添付ファイルとクラウドの添付ファイルである子アイテムだけです。 電子メール署名や画像などの他の種類の子項目は、親アイテムから抽出された後、光学式文字認識 (OCR) によって処理され、子アイテムから任意のテキストを抽出します。 次に、これらの種類の子項目から抽出されたテキストが親アイテムに追加され、レビュー セットで表示できるようになります。 レビュー セットに子アイテムを別のファイルとして追加しないことで、電子情報開示 (Premium) は、レビュー セット内の重要でない可能性のあるアイテムの数を制限することで、レビュー プロセスを合理化するのに役立ちます。

  • 一意の項目。 レビュー セットに追加された一意の項目の数。 一意の項目はレビュー セットに固有です。 レビュー セットに以前のアイテムが存在しなかったため、最初のコレクションが新しいレビュー セットに追加されると、すべての項目が一意になります。

  • 重複する項目を特定しました。 レビュー セットに同じ項目が既に存在するため、レビュー セットに追加されなかったコレクションのアイテムの数。 重複する項目に関する統計は、コレクション見積もりからの推定項目の数と、レビュー セットに追加された実際のアイテム数の違いを説明するのに役立ちます。

インデックス作成

コミットされたレビュー セットの [概要] タブの [インデックス作成] セクションには、レビュー セットに追加された項目に関するインデックス作成情報が含まれています。

  • 新しいインデックス付き項目。 レビュー セットに追加される前に新しくインデックスが作成された項目の数。 新しくインデックス付けされた項目の例としては、親アイテムから抽出された子項目が、レビュー セットに追加される前にインデックスが作成されます。 また、ケース の [データ ソース] タブに一覧表示されている、カストディアル データ ソースと非カストディアン コンテンツの場所に配置されていないアイテムは、レビューに追加される前にインデックスが作成されます。 たとえば、新しくインデックスが作成されたアイテムには、追加の場所から収集されたアイテムが含まれます。

  • インデックス付きアイテムを更新しました。 正常にインデックスが作成され、レビュー セットに追加された部分的にインデックス付けされた項目の数。 この統計は、コレクションがレビュー セットにコミットされたときに正常にインデックスが作成された、カストディアルコンテンツと非カストディアン コンテンツの場所 の部分的にインデックス付けされたアイテムを示します。

  • インデックス作成エラー。 レビュー セットに追加される前にインデックスを作成できなかった部分的にインデックス付けされた項目の数。 これらの項目には、エラーの修復が必要な場合があります。

コレクション ファイルの種類

コミットされたレビュー セットの [概要] タブの [コレクション ファイルの種類] セクションには、コレクションに含まれる各ファイルの種類のアイテム数が表示されます。 ファイルの種類には、電子メール、画像、ドキュメント、オーディオ、ビデオファイルの種類などがあります。 サポートされているファイルの種類の完全な一覧については、「 電子情報開示 (Premium)でサポートされているファイルの種類」を参照してください。

エラー

コミットされたレビュー セットの [概要] タブの [エラー] セクションには、コレクションのコミット時に発生したエラーの種類と数が表示されます。 エラーには、サイズが 0 のファイル、保護されたファイル、形式が正しくないファイル、内部エラーなどが含まれる場合があります。 .csv 形式のエラー レポートは、このセクションの [ エラー レポートのダウンロード ] を選択してダウンロードできます。

コレクション パラメーター

コミットされたレビュー セットの [概要] タブの [コレクション パラメーター] セクションには、レビュー セットに追加されたアイテムの収集に使用されたコレクション情報が表示されます。 このタブには、[ 統計の検索 ] タブの情報に似た情報が表示されます。このセクションでは、コレクションで使用される検索クエリ、検索されたコンテンツの場所、推定コレクションの結果の簡単なスナップ ショットを示します。 前に説明したように、このセクションの推定項目の数は、[ コレクションの内容 ] セクションに表示される親項目の数と等しくなります。

コレクションの [データ ソース] タブ

[ データ ソース ] タブには、カストディアル データ ソースと非カストディアン データ ソースに関する情報が含まれています。 [ カストディアル データ ソース ] セクションには、コレクションに含まれる各カストディアンのすべてのカストディアル データ ソースが表示されます。 [ 非カストディアル データ ソース ] セクションには、コレクションのすべての非カストディアン データ ソースが表示されます。 表示されるデータ ソース情報は、ケースごとに [メイン データ ソース] タブでも使用できます。

コレクションの [統計の検索] タブ

[ 統計の検索 ] タブに表示される統計は、コレクションの見積もりが最後に実行されたときと同じ統計です。 これには、コレクションの見積もり、条件レポート、上位の場所が含まれます。 この情報は、履歴参照のコレクション見積もりから保持され、レビュー セットにコミットされた実際のコレクションと比較できます。

コレクションの見積もりと実際にコミットされたコレクションの違い

コレクション見積もりを実行すると、コレクション条件を満たす項目の数 (およびその合計サイズ) の見積もりが [概要] タブと [統計の検索] タブの [コレクションの見積もり] セクションに表示されます。コレクション見積もりをレビュー セットにコミットした後、レビュー セットに追加された実際のアイテム数 (およびその合計サイズ) は、多くの場合、見積もりと異なります。 ほとんどの場合、コレクションの見積もりから推定されたアイテムよりも多くの項目がレビュー セットに追加されます。 次の一覧では、これらの違いの最も一般的な理由と、それらを識別するためのヒントについて説明します。

  • 子項目。 親アイテムから抽出され、個々のファイルとして追加される子項目 (ファイル添付ファイルやクラウド添付ファイルなど)。 子アイテムの数によって、レビュー セットに追加されるアイテムの数が増える可能性があります。 一般に、コミットされたコレクションの [概要] タブの [コレクションの内容] セクションで識別される親項目の数は、コレクションの見積もりからの推定項目の数と等しい必要があります。

  • 重複する項目。 コレクションの見積もりから、以前のコレクションのレビュー セットに既に追加されている項目は追加されません。 前に説明したように、[概要] タブの [コレクションの内容] セクションに、コレクション内の重複する項目の数が表示されます。

  • コレクション構成オプション。 コレクションの見積もりをレビュー セットにコミットする場合は、会話スレッド、クラウド添付ファイル、およびドキュメント バージョンを含めるオプションが必要です。 レビュー セットに追加されるこれらの項目は、コレクション見積もりの見積もりに含まれません。 これらは、コレクションをコミットしたときにのみ識別され、収集されます。 これらのオプションを選択すると、レビュー セットに追加されるアイテムの数が増える可能性が最も高くなります。

    たとえば、複数のバージョンの SharePoint ドキュメントは、コレクション見積もりの見積もりに含まれません。 ただし、コレクション見積もりをコミットするときに、すべてのドキュメント バージョンを含めるオプションを選択すると、レビュー セットに追加されたアイテムの実際の数 (および合計サイズ) が増えます。

    これらのオプションの詳細については、「 コレクションの見積もりをレビュー セットにコミットする」を参照してください。

コレクションの見積もりからの推定結果が、実際にコミットされた結果と異なる可能性があるその他の理由を次に示します。

  • コレクションの見積もりに対して結果を見積もる方法。 コレクションの見積もりによって返される検索結果の見積もりは、コレクション クエリの条件を満たす項目の見積もり (実際のカウントではなく) だけです。 電子メール アイテムの見積もりをコンパイルするために、検索条件を満たすメッセージ ID の一覧が Exchange データベースから要求されます。 ただし、コレクションをレビュー セットにコミットすると、コレクションが再実行され、実際のメッセージが Exchange データベースから取得されます。 そのため、推定項目数と実際の項目数の決定方法により、違いが生じる可能性があります。

  • コレクションの見積もりを見積もってコミットする時間の間に発生する変更。 コレクションの見積もりをレビュー セットにコミットすると、検索が再実行され、検索条件を満たす検索インデックス内の最新の項目が収集されます。 コレクションの見積もりが最後に実行されてからコレクションの見積もりがレビュー セットにコミットされてからの間に、検索条件を満たす追加の項目が作成、送信、または削除された可能性があります。 コレクションをコミットする前にデータ ソースから削除されたため、コレクションの見積もり結果が推定されたときに検索インデックスに含まれる項目が存在しなくなった可能性もあります。 この問題を軽減する 1 つの方法は、コレクションの日付範囲を指定することです。 もう 1 つの方法は、アイテムが保持され、消去できないようにコンテンツの場所を保留にすることです。

  • インデックスのない項目。 コレクションの見積もりにすべての Exchange メールボックスまたはすべての SharePoint サイトの検索が含まれている場合、コレクション条件に一致するアイテムを含むコンテンツの場所のインデックスのないアイテムのみがレビュー セットに追加されます。 つまり、メールボックスまたはサイトに結果が見つからない場合、そのメールボックスまたはサイト内のインデックスのないアイテムはレビュー セットに追加されません。 ただし、すべてのコンテンツの場所 (コレクション クエリに一致する項目が含まれていないもの) のインデックスのないアイテムは、推定コレクションの結果に含まれます。

  • 部分的にインデックス付けされた項目: このオプションを選択すると、追加のデータ ソースから部分的にインデックス付けされた項目がレビュー セットに追加されます。 コレクションが追加のデータ ソースを検索した場合 (コレクション ウィザードの [ 追加の場所 ] ページで指定したとおり)、レビュー セットに追加するアイテムが、これらの場所から部分的にインデックス付けされている可能性があります。 通常、管理対象データ ソースと管理対象でないデータ ソースには、部分的にインデックス付けされたアイテムはありません。 これは、管理対象データ ソースと管理対象でないデータ ソースがケースに追加されたときに、高度なインデックス作成プロセスによってアイテムのインデックスが再作成されるためです。 また、[部分的にインデックス付けされたアイテムを追加]すると、レビュー セットに追加されるアイテムの数が増加します。

    部分的にインデックスが付いた項目がレビュー セットに追加されたら、フィルターを適用して、これらの項目を具体的に表示できます。 詳細については、「シナリオの例: 部分的にインデックスが作成された項目をフィルター処理する」を参照してください。

    または、コレクションの見積もりに特定のコンテンツの場所が含まれている場合 (つまり、コレクション見積もりウィザードの [追加の場所 ] ページで指定されている特定のメールボックスまたはサイト)、検索で指定されたコンテンツの場所からインデックスのないアイテム (コレクション条件によって除外されない) がエクスポートされます。 この場合、インデックスのないアイテムの推定数と、レビュー セットに追加されるインデックスのないアイテムの数は同じである必要があります。