Semantic Index for Copilot

セマンティック インデックスは Microsoft 365 検索の新機能であり、Microsoft Graph を使用して個人および組織のデータとの対話を改善します。 これは、Search と Copilot エクスペリエンスの未来を可能にする新しいインデックスを作成します。 セマンティック インデックスは、Microsoft Graph のセキュリティとポリシーに従います。 ユーザーが検索または Microsoft Copilot でクエリを実行するたびに、ユーザーのセキュリティ コンテキストが常に表示され、ユーザーがアクセスできるコンテンツのみが表示されます。

概要

セマンティック インデックスは Microsoft Graph の上に位置し、ユーザー クエリを解釈して、生産性を高めるのに役立つコンテキストに関連する応答を生成します。 これにより、組織は何十億ものベクトル (特徴や属性の数学的表現) を検索し、関連する結果を返すことができます。 セマンティック インデックスは、Microsoft Graph 全体の機能強化と組み合わせることで、organization内の関連情報と結び付け、セキュリティ、コンプライアンス、プライバシーに対する Microsoft の包括的なアプローチに基づいて構築され、テナント内のすべての組織の境界を尊重します。

インデックスとは

データのインデックス作成の概念は Microsoft 365 で十分に確立されており、現在の Microsoft 365 テナント内の膨大な量のデータにアクセスするために Microsoft Graph がどのように機能するかの通常の部分です。 ユーザーには、Microsoft Graph からの検索結果が表示されます。これにより、テナント内のほとんどの Microsoft 365 アプリケーションのコンテンツとシグナルにインデックスが作成され、ネットワーク内のコンテンツとユーザー間の接続に基づいて検索結果がカスタマイズおよび昇格されます。

Microsoft Graph のデータとのやり取りは、キーワード (keyword)照合、パーソナル化、ソーシャル マッチングに基づいています。 キーワード検索クエリは、Microsoft Graph のインデックスに対してクエリを実行します。これは、ドキュメントまたはドキュメントのセット内の場所にマップされます。 Microsoft 365 では、Microsoft Graph を使用して、ユーザーとその近いネットワークに対する追加シグナルに関する知識に基づいて、最も関連性の高いコンテンツをランク付けします。 これは、Microsoft 365 のパーソナル化とソーシャル マッチングと呼ばれ、organization内のコンテンツに対するクエリの関連性を高めます。 Microsoft Graph のテナント データへのアクセスは、ロールベースのアクセス制御によって制御されます。 組織は常に、Microsoft 365 管理センターの検索およびインテリジェンス ポータルを使用して Microsoft Search 機能を制御しています。

セマンティック インデックスがデータの管理にどのように役立つか

セマンティック インデックスは、キーワード、個人の好み、ソーシャル接続に基づいて関連するコンテンツを見つけることができる Microsoft 365 の機能を強化します。 これを行うには、概念理解を可能にするベクター化されたインデックスを作成します。これは、探しているものを識別するのに役立ち、必要な組織のコンテンツにアクセスするのに役立ちます。 ベクトルは、単語、画像ピクセル、またはその他のデータ ポイントの数値表現です。 ベクトルは、類似度を表すために近接して配置された近い数値で配置またはマップされます。 標準的なキーワード (keyword)インデックスとは異なり、ベクトルは、意味的に類似したデータ ポイントがベクター空間にクラスター化される多次元空間に格納され、Microsoft 365 は"完全一致" を超える広範な検索クエリセットを処理できます。 次の図は、テキスト (ベクター化されたインデックスで使用される数値ではなく) を使用して、データ ポイント間の類似性の例を示しています。

セマンティック インデックスのデータ ポイントをクラスター化する方法の例を示す図。

セマンティック インデックスを使用すると、ベクター距離または類似性に基づいてデータを高速かつ正確に類似度で検索および取得できます。 つまり、セマンティック インデックスは、完全一致または定義済みの条件に基づいてクエリを実行するために従来のメソッドを使用する代わりに、セマンティックまたはコンテキストの意味に基づいて最も類似または関連するデータを検索できることを意味します。

機能

次のセマンティック インデックス機能は、検索結果を強化する以上の機能を備えています。これらは連携して、データを理解し、情報をより迅速に見つけ、生産性を向上させるのに役立ちます。 ユーザーは、Microsoft Copilot for Microsoft 365統合を使用して、セマンティック インデックスを最初に操作できます。 時間の経過と共に、Microsoft は SharePoint Online、Microsoft Teams、およびセマンティック インデックスを持つ Microsoft 365 アプリでの検索エクスペリエンスも向上します。 Microsoft 365 E3/E5、Microsoft 365 Business Standard、Business Premium のお客様向けにセマンティック インデックスを展開しています。 また、セマンティック インデックスを、有料の Copilot ライセンスを持つ Microsoft 365 A3、A5、Office 365 E3、E5 ユーザーに拡張しています。 可用性に関する状態の更新は、Microsoft 365 管理センターMicrosoft 365 パブリック ロードマップを介して共有されます。 情報を探すときの各機能の動作の詳細を次に示します。

Microsoft Copilot と Graph ベースのチャット

セマンティック インデックスは、クエリの意図を理解し、Microsoft Copilot プロンプトに追加情報を追加することで、Microsoft Copilot 内の結果を Graph ベースのチャットで表示するのに役立ちます。 関連情報は Microsoft Graph とセマンティック インデックスで取得され、LLM に理由の詳細を提供します。 たとえば、Microsoft Copilot に、同僚がベンダーの設計作業を称賛するメールを見つけたいとします。 セマンティック インデックスには、検索領域を広げ、最適な結果を得るために、検索に近い単語 (例: 省略、興奮、驚き) が含まれます。 この作業はすべて、複雑さを増すことなく、Microsoft Copilot で検索した結果に関連性を追加するために、バックグラウンドで行われます。

セマンティック検索では、意味的に似たテキストに似た数値が含まれるよう、クエリの意味的な意味がキャプチャされ、言語をよりよく理解できます。 ベクトルを使用すると、セマンティック検索では、さまざまな形式の単語 (技術、テクノロジ、テクノロジなど) 間の関係を理解できます。米国、米国、米国、米国のアメリカ;犬、猫、ペット)、および自然に検索できる情報の量を拡大するためにシノニムをキャプチャします。 これらの機能強化は、セマンティック検索が文、スニペット、ドキュメント、会議の意図を理解するのに役立ちます。 また、クエリまたはサンプル コンテンツに関連する資産を識別し、Microsoft Copilot for Microsoft 365と対話するためのユーザーを準備します。

セマンティック インデックスのしくみ

セマンティック インデックスは、 Microsoft 365 アプリ、SharePoint Online、および Microsoft Teams で Microsoft Copilot と検索結果を強化します。 これは、Microsoft によって自動的に有効にされるオンライン データの強化された検索エクスペリエンスと概念的理解をサポートするために、2 つのインデックスを作成することで行われます。

ユーザー レベルのインデックス作成では、作業データ のセットに対してのみ、目に合わせたインデックスが作成され、日常的なタスクで使用しやすくなっています。 これには、メール、メンションドキュメント、コメントや共有など、作成または操作するテキスト ベースのコンテンツが含まれます。 テナント レベルのインデックスは、サイトの継承を介してorganization内の 2 人以上がアクセスできるテキスト ベースの SharePoint Online ファイルを追加します。 ただし、ユーザーがロールベースのアクセス制御によって制御されるコンテンツに既にアクセスできる場合にのみ、結果がユーザーに表示されます。 さらに、SharePoint Online サイトは検索可能なままである必要があります。

次のセクションでは、各インデックスを有効にする方法、Copilot for Microsoft 365のデータ フローでセマンティック インデックスを使用する方法、各インデックスで処理できるファイルの種類、および各インデックスが更新を処理する方法について説明します。

有効化

私たちは、管理上の関与なしに、Copilot for Microsoft 365と適格な Microsoft 365 ライセンスを持つすべての組織にセマンティック インデックスをロールアウトする初期段階にあります。

Microsoft 365 管理 センターで以前にセマンティック インデックス有効化状態インジケーターがわかりにくいというフィードバックをお客様から受け取っています。 お客様の混乱を減らすために、より良いアプローチを決定できるようになるまで、インジケーターを一時的に削除しました。 お客様に優れた検索エクスペリエンスを提供するというコミットメントに変更はなく、Microsoft は組織のインデックスを自動的に作成し続けます。

データ フロー

セマンティック インデックスは Microsoft Graph と対話して、ユーザー レベルおよびテナント レベルのインデックスの情報にアクセスできるようにします。 次の図は、Copilot for Microsoft 365を使用した要求に対するデータフローのしくみを示しています。

Copilot for Microsoft 365、Microsoft 365 Apps、Microsoft Graph、および Large Language Model の関係を示す図。

Microsoft 365 アプリからのユーザー プロンプトは Copilot (1) に送信され、Copilot は処理のために Microsoft Graph とセマンティック インデックスにアクセスします (2)。 Copilot は、変更されたプロンプトを大きな言語モデル (3) に送信し、LLM 応答 (4) を受け取り、後処理のために Microsoft Graph とセマンティック インデックスにアクセスします (5)。 その後、Copilot は応答とアプリ コマンドを Microsoft 365 アプリに送信します。 すべての要求は HTTPS によって暗号化され、顧客データは保存時に暗号化されたままになります。

サポートされているコンテンツ タイプ

セマンティック インデックスでは、次の表に示すユーザー メールボックスとファイルの種類のインデックス作成がサポートされており、時間の経過と共により多くの種類のファイルがサポートされています。 テーブルには、ユーザー レベルのインデックスとテナント レベルのインデックスでサポートされているファイルの種類の一覧が含まれています。

コンテンツ/ファイルの種類 ユーザー レベル テナントのレベル
ユーザー メールボックス サポート 該当なし
委任されたメールボックス 非サポート 該当なし
共有メールボックス 非サポート 該当なし
アーカイブされたメールボックス データ 非サポート 該当なし
アーカイブされた SharePoint データ 非サポート 非サポート
ドキュメントのWord (doc/docx) サポートされている サポートされている
PowerPoint (pptx) サポートされている サポートされている
PDF ファイル サポート サポート
Web ページ (aspx) サポート サポート
OneNote ファイル (1) サポート サポート
Graph コネクタ のデータ 該当なし サポート

インデックスの更新

セマンティック インデックスが初めて顧客のインデックス作成を完了すると、ユーザーによって作成されたドキュメントは、ユーザーのメールボックスでほぼリアルタイムでインデックスが作成されます。 サイトの継承によって 2 人以上のユーザーがアクセスできる SharePoint Online サイトに追加された新しいドキュメントは、毎日インデックスが作成されます。 インデックス付きユーザーとテナント レベルのドキュメントが更新されると、変更はすぐにインデックスが作成されます。

管理

Microsoft 365 管理センターを使用してセマンティック インデックスを準備および管理するためのオプションのアクティビティを管理者に提供します。 セマンティック インデックスを有効にするために管理上の関与は必要ありません。サービスは Microsoft によって自動的に有効になります。 セマンティック インデックスは Microsoft 365 Search の機能強化であり、無効にすることはできません。

管理者は、 SharePoint でのファイル コラボレーションの計画と計画と展開 に関する考慮事項を確認し、SharePoint モダン エクスペリエンスでアクセス許可を共有することで、セマンティック インデックスの準備と管理を選択できます。 管理者は、Microsoft Purview データ損失防止 (DLP) でのデータの除外に関する考慮事項を確認することで、セマンティック インデックスからファイルを除外することを選択できます。 DLP ソリューションが存在しない場合、管理者は SharePoint Online サイトをテナント レベルのインデックスから除外できます。

SharePoint Online サイトを除外する

Microsoft Purview データ損失防止を持たない組織が、SharePoint Online サイトのデータを Microsoft Search によってインデックス付けすることを望む場合があります。 これらの手順は、給与、人事、財務情報などの機密データに対してのみ考慮する必要があります。 SharePoint Online サイトを除外するには、次の手順に従います。

  1. 適切な管理者権限を持つサイトを参照します。
  2. ドロップダウン メニューから [設定] を選択し、[ サイト情報 ] を選択します。
  3. [ すべてのサイト設定を表示] を選択して、[サイトの設定] ページを表示します。
  4. [検索] カテゴリの [検索とオフラインの可用性] を選択し、[このサイトを検索結果に表示することを許可する] で [いいえ] を選択して、Microsoft Search とセマンティック インデックス検索の両方から除外します。 これは、複数のサイトに対して PowerShell で実行することもできます。

SharePoint オンライン サイトを除外するための設定を示すスクリーンショット。

Microsoft Search とセマンティック インデックスでは、テナント レベルのインデックスからの SharePoint オンライン コンテンツの除外のみがサポートされます。 Microsoft Search のみまたはセマンティック インデックスから結果を除外するオプションはありません。アクションは両方に同時に適用されます。

Item Insights の構成

Microsoft 365 管理センターの [検索とインテリジェンス] ページで、Item insights が既定で有効になっています。 ユーザーまたはアイテムの分析情報をオフにすると、配布グループや組織のグラフから派生した関連ユーザーが結果に含まれないので、Microsoft Search とセマンティック インデックスのエクスペリエンスが低下します。

  • People分析情報は、Microsoft 365 でのパブリック コラボレーション作業に基づいて、ユーザーに関連するユーザーの一覧を提供します。 パブリック コラボレーションには、パブリック配布グループのメンバーと、組織のグラフに接続されている個人が含まれます。

  • アイテム分析情報を使用すると、Microsoft 365 での共同作業に基づいて、organizationのユーザーに対する推奨事項を得ることができます。 これらの推奨事項には、ドキュメントやその他の種類のコンテンツが含まれますが、これらに限定されず、ユーザー カード (連絡先)、Delve、 Microsoft 365 アプリ、Microsoft Copilot の結果、その他の場所に表示されます。

Item insights と People Insights の両方で、ユーザー自身のデータに基づくパーソナル化機能はカバーされません。

サード パーティの情報を組み込む

セマンティック インデックスは、組織が Microsoft 365 の外部にある組織のデータまたはコンテンツをCopilot for Microsoft 365と Microsoft 365 エコシステムに取り込む方法を提供します。 グラフ コネクタを使用すると、外部データ ソースを取り込むことができます。これにより、Microsoft 365 データとサード パーティのデータの両方を活用する関連する結果でユーザーの Copilot エクスペリエンスを強化できます。 Microsoft では、コンテンツのアクセス制御を維持しながら、すべての Graph コネクタ データにインデックスを作成します。 これにより、Microsoft 365 生産性アプリと広範な Microsoft エコシステムで検索できるコンテンツ ソースの種類が拡張され、コネクタ コンテンツがテキストリッチな場合に最適に機能します。 サード パーティのデータは、オンプレミスまたはパブリック クラウドまたはプライベート クラウドでホストできます。この情報は Microsoft Graph によって使用されます。この情報は、セマンティック インデックスに取り込んで、Microsoft 365 とorganizationのサード パーティコンテンツ全体のすべてのコンテキストをorganizationに提供するのに役立ちます。 Microsoft 365 EnterpriseとCopilot for Microsoft 365のグラフ コネクタ ライセンス要件の詳細については、「ライセンスの要件と価格」を参照してください。

さらに、Bing、Microsoft Dataverse、Jira、Trello、Mural、Confluence、Freshworks、Priority Matrix を使用した Web 検索を含む、30 を超えるプラグインと Graph コネクタが利用できるようになりました。 既存の Teams メッセージ拡張機能と Microsoft Power Platform コネクタをCopilot for Microsoft 365と統合するため、今後数か月以内に数千もの追加の基幹業務プラグインとサード パーティ製プラグインが有効になります。 毎日作業に使用されるツールに示されているCopilot for Microsoft 365プラグインのこの広範なエコシステムは、作業がどのように一緒に行われるかを変革する際に、お客様にこれまでにない価値をもたらします。

プライバシー、コンプライアンス、セキュリティ

Microsoft 365 テナント内のアクセス許可モデルは、ユーザー、グループ、テナント間でデータが意図せず漏洩しないようにするのに役立ちます。 セマンティック インデックスは、他の Microsoft 365 サービスで使用されるデータ アクセスに対して同じ基になるコントロールを使用して、各個人がアクセスできるデータのみを示します。 セマンティック インデックスでは、ユーザー ID ベースのアクセス境界が適用されるため、接地プロセスは現在のユーザーがアクセスを許可されているコンテンツにのみアクセスします。 詳細については、 Microsoft のプライバシー ポリシーとサービスに関するドキュメントを参照してください

Microsoft Copilot for Microsoft 365は、Microsoft 365 商用のお客様 (一般データ保護規則 (GDPR) や欧州連合 (EU) データ境界など) に対する既存のプライバシー、セキュリティ、コンプライアンスに関するコミットメントに準拠しています。 セマンティック インデックスを介してアクセスされるプロンプト、応答、データは、Copilot for Microsoft 365で使用されるものも含め、基礎 LLM のトレーニングには使用されません。 詳細については、「Copilot for Microsoft 365のデータ、プライバシー、セキュリティ」を参照してください。

ストレージと処理

セマンティック インデックスによって生成されたデータは、会社のテナント内に残り、セキュリティ、コンプライアンス、ID、およびプライバシー ポリシーとプロセスに準拠します。 セマンティック インデックスは、ユーザーが既にアクセス許可を持ち、ストレージ クォータに影響しないコンテンツでのみ機能します。

ユーザー レベルのインデックス情報は、ユーザーのメールボックスが配置されている場所に格納され、テナント レベルのインデックス情報は、SharePoint サイトが配置されているリージョン (ホーム リージョン、またはテナント管理者によって指定された) にある分離された保護された顧客のテナント コンテナーに格納されます。 欧州連合データ境界 (EUDB) 内のお客様の場合、インデックスは EU/EFTA ベースのデータセンターに格納されます。 他の顧客の処理は、テナント リージョンまたは米国で行うことができます。 複数地域の組織では、すべての地理的境界が尊重されます。 リージョン内データは、各リージョンに格納および処理されます。 クエリ時に、フェデレーション クエリはすべてのリージョンに送信され、セマンティック インデックスとキーワード (keyword)検索結果がユーザーへの 1 つの応答にマージされます。

Microsoft Purview カスタマー キー (BYOK) のサポート

セマンティック インデックスは、ユーザー レベルのインデックスとテナント レベルのインデックスの両方に対して、環境内で BYOK を有効にしている企業に対して BYOK サポートを提供します。 Microsoft は、BYOK 対応のお客様のセマンティック インデックスを管理上の関与なしに自動的に有効にします。

情報保護

検索のコンテキストでは、情報保護機能を使用してセマンティック インデックスからデータを除外する他の方法はありません。 セマンティック インデックスは Microsoft Search からセキュリティとプライバシーの設定を継承し、サード パーティのコネクタから取り込まれたデータには、他の Microsoft 365 データと同じストレージと保護が提供されます。 追加の情報保護オプションを調査している組織の場合、Microsoft 365 は、Microsoft 365 アプリとアドオン製品に組み込みの機能を提供し、管理者がデータの最小化とオーバーシェアを減らすことで組織のデータを保護するのに役立ちます。 次のセクションでは、組織が参照するためにのみ使用できるオプションについて説明します。

データの最小化

データの最小化により、organization内でアクセスできるデータの量が減ります。 コンプライアンスや規制の要件にはコンテンツの保持と削除が必要なことがよくありますが、ビジネス価値を持たなくなったコンテンツを削除すると、リスクと責任を管理することもできます。 Microsoft Purview データ ライフサイクル管理は、個別にライセンスが付与され、大規模な管理のアイテム保持ポリシーで不要になったコンテンツや、例外ときめ細かい制御の保持ラベルを削除するために使用できます。

オーバーシェアリングを減らす

組織は長い間、Microsoft 365 管理センターと SharePoint Online の既存のコントロールを使用して、Microsoft 365 でのオーバーシェアリングを減らすためのアクションを実行できました。 セマンティック インデックスはコンテンツへのアクセス許可を変更せず、ユーザーが同僚と情報を共有する方法の原則を変更しない点に注意することが重要です。 たとえば、セマンティック インデックスでは、テナント レベル インデックスのorganization部分のすべてのユーザーと連携するリンクでコンテンツが共有されることはありません。 アクセスできるリンクを選択したユーザーのみが、ユーザー インデックスに情報を追加します。 組織は、情報保護オプションを調べるとき、次の点を考慮することをお勧めします。

  • セキュリティで保護されたファイルコラボレーションを計画 する – ファイルコラボレーションの計画と展開 に関するページを参照して、ユーザーに安全で生産的なファイルコラボレーション環境を運用するための推奨プラクティスの詳細を理解します。

  • リストを減らすためのデータへのユーザー アクセスの適切なサイズ – SharePoint Online サイトの除外リストを継承し、セマンティック インデックスに存在するアクセス制御チェックをリアルタイムで実行することで、オーバーシェアを減らします。 組織は、 Syntex SharePoint Advanced Management アドオン を使用して、これらのアクセス許可を管理および管理することを検討できます。

  • 秘密度ラベルを使用する - もう 1 つの方法は、Microsoft Purview 情報保護秘密度ラベルを使用してデータにラベルを付ける方法です。 暗号化を適用するラベルは、使用権限を使用して追加の保護レイヤーを提供します。これらは検索トリミングにも含まれます (つまり、視覚的なマーキングとアクセス制限に使用されるフィルター処理とアプリケーション側ルールでサポートされます)。

  • アクセスの制限Microsoft Purview データ損失防止はMicrosoft 365 E5で使用でき、過共有として報告されたドキュメントへのアクセスをさかのぼって一時的に制限するために使用できます。 Microsoft 365 E5顧客でない場合、組織は 90 日間の Microsoft Purview ソリューション試用版を使用して、追加の Purview 機能がデータのセキュリティとコンプライアンスのニーズを管理organizationにどのように役立つかを調べることができます。

高度な情報保護ソリューションを展開する方法について詳しくは、 Microsoft Purview を使用して情報保護ソリューションを展開する方法を説明する次の記事をご覧ください。 Microsoft Purview がCopilot for Microsoft 365のデータ セキュリティとコンプライアンスの要件を強化する方法の詳細については、「Microsoft Purview とのCopilot for Microsoft 365操作を保護および管理する」を参照してください。

その他のリソース

Microsoft 365、Microsoft Graph、セマンティック インデックスを使用すると、Microsoft 365 データを利用した検索、チャット、および副操縦に対する前例のない表現が可能になります。 この表現力は、Microsoft 365 と Copilot for Microsoft 365を使用して組織のデータを最大限に活用するために、適切な接地データを表示するのに役立ちます。

Copilot for Microsoft 365の詳細については、次のリソースをチェックします。