Enterprise Websites クラウド Microsoft 365 Copilot コネクタ

2025-06-16

Enterprise Websites クラウド Microsoft 365 Copilot コネクタを使用すると、organizationは、会社所有の Web サイトまたはインターネット上のパブリック Web サイトの Web ページやコンテンツにインデックスを作成できます。 Web サイトからコネクタとインデックスコンテンツを構成した後、エンドユーザーは Microsoft Search でそのコンテンツを検索し、Microsoft 365 Copilotできます。

この記事は、Microsoft 365 管理者、または Enterprise Websites クラウド Microsoft 365 Copilot コネクタを構成、実行、監視するユーザーを対象とします。

重要

オンプレミスまたはプライベートクラウドでホストされている Web サイトのインデックスを作成するには、オンプレミスの Enterprise Websites オンプレミス Copilot コネクタを使用できます。

機能

クラウドアクセス可能な Web サイトから Web ページにインデックスを作成します。
1 つの接続で最大 50 個の Web サイトにインデックスを作成します。
除外ルールを使用してクロールから Web ページを除外します。
Copilot でセマンティック検索を使用して、ユーザーが関連するコンテンツを検索できるようにします。

これらは、サポートされているファイルの種類です。

ファイル拡張子	ファイルの種類	説明
.pdf	PDF	Portable Document Format
.odt	OpenDocument テキスト	OpenDocument テキストドキュメント
.ods	OpenDocument スプレッドシート	OpenDocument スプレッドシート
.odp	OpenDocument プレゼンテーション	OpenDocument プレゼンテーション
.odg	OpenDocument グラフィックス	OpenDocument グラフィックス
.xls	Excel (古い)	Excel スプレッドシート (古い形式)
.xlsx	Excel (新規)	Excel スプレッドシート (新しい形式)
.ppt	PowerPoint (古い)	PowerPointプレゼンテーション (旧形式)
.pptx	PowerPoint (新規)	PowerPointプレゼンテーション (新しい形式)
.doc	Word (古い)	Word ドキュメント (旧形式)
.docx	Word (新規)	ドキュメントのWord (新しい形式)
.csv	CSV	Comma-Separated 値
.txt	プレーンテキスト	プレーンテキストファイル
.xml	XML	拡張可能なマークアップ言語
.md	Markdown	Markdown ファイル
.rtf	リッチテキスト形式	リッチテキスト形式
.tsv	タブ区切り値	Tab-Separated 値
.gif	GIF	グラフィックス交換形式
.jpeg	JPEG	JPEG 画像
.jpg	JPG	JPEG 画像
.png	PNG	ポータブルネットワークグラフィックス
.mp3	MP3	MPEG オーディオレイヤー III
.wav	WAV	波形オーディオファイル形式
.aiff	AIFF	オーディオインターチェンジファイル形式
.flac	FLAC	無料のロスレスオーディオコーデック
.aac	AAC	高度なオーディオコーディング
.alac	ALAC	Apple Lossless Audio Codec
.wma	WMA (Lossy)	Windows Media Audio (Lossy)
.wma	WMA (ロスレス)	Windows Media Audio (ロスレス)
.ogg	OGG	Ogg Vorbis オーディオ形式
.pcm	PCM	Pulse-Code モジュレーションオーディオ
.mp4	MP4	MPEG-4 ビデオファイル
.mkv	MKV	Matroska ビデオファイル
.avi	AVI	オーディオビデオインターリーブ
.wmv	WMV	Windows Media ビデオ
.mov	MOV	Apple QuickTime ムービー
.flv	FLV	Flash Video Format
.avchd	AVCHD	Advanced Video Coding High Definition
.webm	WebM	Web メディアファイル
.mpeg	MPEG-2	動画エキスパートグループの形式
.hevc	HEVC/H.265	高効率ビデオコーディング

これらは、サポートされている MIME の種類です。

MIME タイプ	説明
text/html	Web ページの構造の書式設定に使用される HyperText マークアップ言語 (HTML)。
text/webviewhtml	WebView コントロールでレンダリングされる Web コンテンツに使用される MIME の種類。
text/x-server-parsed-html	サーバー側インクルード (SSI) でよく使用されるサーバー解析 HTML ドキュメント。

制限事項

SAML、JWT トークン、Forms ベースの認証などの認証メカニズムはサポートされていません。
Web ページでの動的コンテンツのクロールはサポートされていません。

前提条件

organizationの Microsoft 365 テナントの検索管理者である必要があります。
Web サイト URL: Web サイトのコンテンツに接続するには、Web サイトへの URL が必要です。 1 つの接続で複数の Web サイトにインデックスを作成できます (最大 50)。
サービスアカウント (省略可能): サービスアカウントは、Web サイトで認証が必要な場合にのみ必要です。パブリック Web サイトは認証を必要とせず、直接クロールできます。認証を必要とする Web サイトの場合は、コンテンツを認証してクロールするための専用アカウントを用意することをお勧めします。

はじめに

表示名

表示名は、Copilot の各引用文献を識別するために使用され、ユーザーが関連付けられているファイルまたは項目を簡単に認識するのに役立ちます。表示名は、信頼されたコンテンツも示します。表示名は、コンテンツソースフィルターとしても使用されます。このフィールドには既定値が存在しますが、organizationのユーザーが認識する名前にカスタマイズできます。

インデックスへの Web サイト URL の追加

クロールする Web サイトのルートを指定します。 Enterprise Websites クラウド Copilot コネクタは、この URL を開始点として使用し、クロールのためにこの URL からのすべてのリンクに従います。 1 つの接続で最大 50 個の異なるサイト URL のインデックスを作成できます。

コネクタは、ルート URL のドメイン内の Web ページのみをクロールし、ドメイン外 URL のクロールをサポートしていません。リダイレクトは、同じドメイン内でのみサポートされます。クロールする Web ページにリダイレクトがある場合は、クロールする URL の一覧にリダイレクトされた URL を直接追加できます。

クロールにサイトマップを使用する

選択すると、コネクタはサイトマップに一覧表示されている URL のみをクロールします。このオプションを使用すると、後の手順で増分クロールを構成することもできます。選択されていない場合、またはサイトマップが見つからない場合、コネクタはサイトのルート URL で見つかったすべてのリンクのディープクロールを実行します。

このオプションを選択すると、クローラーは次の手順を実行します。

a. クローラーは、ルートの場所で robots.txt ファイルを検索します。たとえば、指定した URL が https://www.contoso.comされている場合、クローラーは https://www.contoso.com/robots.txtで robots.txt ファイルを検索します。

b. robots.txt ファイルを見つけると、クローラーは robots.txt ファイル内のサイトマップリンクを見つけます。

c. その後、クローラーはサイトマップファイルに一覧表示されているすべての Web ページをクロールします。

d. 上記のいずれかの手順でエラーが発生した場合、クローラはエラーをスローすることなく、Web サイトのディープクロールを実行します。

指定したサブディレクトリの下のページのみにインデックスを付け

Web サイトコネクタには、指定された指定されたサブディレクトリの下にある Web ページにのみインデックスを付けるオプションが用意されています。

このオプションが オンでない場合、コネクタは常に URL のルートからクロールを開始します。たとえば、指定した URL が https://www.contoso.com/electronicsされている場合、コネクタは https://www.contoso.comからクロールを開始します。
このオプションをオンにすると、コネクタは正確な入力 URL からクロールを開始します。たとえば、指定した URL が https://www.contoso.com/electronicsされている場合、コネクタは https://www.contoso.com/electronicsからクロールを開始します。

認証の種類を指定する

選択した認証方法は、接続でインデックスを作成するために指定したすべての Web サイトに適用されます。 Web サイトからコンテンツを認証して同期するには、サポートされている 5 つの方法のいずれかを 選択します。

a. なし
認証要件なしで Web サイトにパブリックにアクセスできる場合は、このオプションを選択します。

b. [ 基本認証]
基本認証を使用して認証するには、アカウントのユーザー名とパスワードを入力します。

ヒント

認証のためにユーザー名の複数の順列を試してください。例-

username
username@domain.com
domain/username

c. SiteMinder
SiteMinder 認証には、適切な形式の URL、 https://custom_siteminder_hostname/smapi/rest/createsmsession、ユーザー名、パスワードが必要です。

d. OAuth 2.0 クライアント資格情報のMicrosoft Entra
Microsoft Entra IDを使用する OAuth 2.0 には、リソース ID、クライアント ID、およびクライアントシークレットが必要です。

リソース ID、クライアント ID、およびクライアントシークレットの値は、Web サイトのMicrosoft Entra ID ベースの認証のセットアップ方法によって異なります。指定した 2 つのオプションの 1 つが、Web サイトに適している場合があります。

Microsoft Entra アプリケーションを ID プロバイダーとクライアントアプリの両方として使用して Web サイトにアクセスする場合、クライアント ID とリソース ID はこの単一アプリケーションのアプリケーション ID であり、クライアントシークレットはこのアプリケーションで生成したシークレットです。

注:

クライアントアプリケーションを ID プロバイダーとして構成する詳細な手順については、「クイックスタート: Microsoft ID プラットフォームにアプリケーションを登録する」および「Microsoft Entraログインを使用するようにApp ServiceまたはAzure Functions アプリを構成する」を参照してください。

クライアントアプリが構成されたら、アプリの [証明書 & シークレット ] セクションに移動して、新しいクライアントシークレットを作成します。ページに表示されているクライアントシークレットの値は、再び表示されないためコピーします。

次のスクリーンショットでは、クライアント ID とクライアントシークレットを取得し、独自にアプリを作成している場合にアプリを設定する手順を確認できます。
- [ブランド化] セクションの設定を表示します。
- [認証] セクションの設定を表示します。
  
  注:
  
  Web サイトのリダイレクト URI に上記のルートを指定する必要はありません。認証に Azure によって送信されたユーザートークンを Web サイトで使用する場合にのみ、ルートを作成する必要があります。
- [Essentials] セクションのクライアント ID の表示:
- [証明書 & シークレット] セクションでクライアント シークレットを 表示します。
Web サイトの ID プロバイダーとしてアプリケーション (最初のアプリ) をリソースとして使用し、別のアプリケーション (2 番目のアプリ) を使用して Web サイトにアクセスする場合、クライアント ID は 2 番目のアプリのアプリケーション ID であり、クライアントシークレットは 2 番目のアプリで構成されたシークレットです。ただし、リソース ID は最初のアプリの ID です。

注:

クライアントアプリケーションを ID プロバイダーとして構成する手順については、「クイックスタート: Microsoft ID プラットフォームにアプリケーションを登録する」および「Microsoft Entra ログインを使用するようにApp ServiceまたはAzure Functions アプリを構成する」を参照してください。

このアプリケーションでクライアントシークレットを構成する必要はありませんが、[アプリ ロール] セクション にアプリロールを追加する必要があります。これは後でクライアントアプリケーションに割り当てられます。アプリロールを追加する方法については、画像を参照してください。
- 新しいアプリロールの作成:
- 新しいアプリロールの編集:
  
  リソースアプリを構成したら、クライアントアプリを作成し、クライアントアプリの API アクセス許可で上記で構成したアプリロールを追加して、リソースアプリにアクセスするためのアクセス許可を付与します。
  
  注:
  
  クライアントアプリにアクセス許可を付与する方法については、「クイックスタート: Web API にアクセスするようにクライアントアプリケーションを構成する」を参照してください。
次のスクリーンショットは、クライアントアプリにアクセス許可を付与するセクションを示しています。
- アクセス許可の追加:
- アクセス許可の選択:
- アクセス許可の追加:
アクセス許可が割り当てられたら、[証明書 & シークレット] セクションに移動して、このアプリケーションの新しいクライアントシークレットを作成する必要があります。ページに表示されるクライアントシークレットの値は、再び表示されないためコピーします。このアプリのアプリケーション ID をクライアント ID として使用し、このアプリのシークレットをクライアントシークレットとして使用し、最初のアプリのアプリケーション ID をリソース ID として使用します。

e. OIDC クライアント資格情報 (任意の ID プロバイダー)
OIDC クライアント資格情報フローは、任意の ID プロバイダーを使用したマシン間認証用に設計されています。 OIDC クライアント資格情報認証を構成するには、承認サーバー (Okta、Auth0、Keycloak、Ping Identity など) にアプリケーションを登録する必要があります。

構成に必要な入力:

クライアント ID: 登録中にアプリケーションに割り当てられた識別子。
クライアントシークレット: 登録中にアプリケーションに割り当てられたシークレットキー。
スコープ: アプリケーションに必要なアクセス許可の一覧。これらのスコープは、承認サーバーで事前に定義されています。 (たとえば、 read:data write:data admin:operations)
トークンエンドポイント URL: トークンが要求される承認サーバー上の特定のエンドポイント。

例: Okta OIDC クライアント資格情報認証

例を示すために、ID プロバイダーとして Okta を使用した OIDC クライアント資格情報認証の構成を見てみましょう。次の手順は例示であり、実装によって異なる場合があります。 OIDC 認証を構成する方法については、Okta のドキュメントを参照してください。

Okta で OIDC アプリ統合を作成する
- Okta 管理コンソールの [アプリケーション] > [アプリケーション] に移動します。
- [ アプリ統合の作成 ] をクリックし、[ OIDC - OpenID Connect] を選択します。
- アプリケーションの種類として [サービス] または [Web] を選択します。
アプリケーション設定の構成:
- アプリケーション名: アプリケーションにわかりやすい名前 ("My Client Credentials App" など) を指定します。
- ロゴ (省略可能): 必要に応じてロゴをアップロードします。
- 許可の種類: [クライアント資格情報] を選択します。他のフローに必要な場合を除き、他の許可の種類を無効にします。
- サインインリダイレクト URI: クライアント資格情報を使用しているため、リダイレクト URI を構成する必要はありません。
- ログアウトリダイレクト URI (省略可能): 通常、クライアント資格情報には必要ありません。
- [完了] をクリックします。
クライアント認証方法の設定
- [ クライアント 認証] ドロップダウンで [ クライアント シークレット] を選択します。
- [保存] をクリックしてクライアントシークレットを生成します (1 回だけ表示されます)。
スコープの構成
- [スコープ] で、OAuth 2.0 スコープ ( read:data、 write:data など) を割り当てます。これらは単なる名前です。アプリケーションで何を意味するのかを定義します。
- スコープが必要な API アクセス許可と一致していることを確認します。
ユーザー/グループにアプリを割り当てる
- [割り当て] タブで、関連するユーザーまたはグループにアプリを割り当てます。
- サービスアプリの場合でも、割り当てによってポリシーが正しく適用されます。
トークンエンドポイントの構成
- トークン URL は通常、 https://{yourOrg}.okta.com/oauth2/v1/tokenされます。
- このエンドポイントを使用して、アクセストークンを要求します。

4. 限定対象ユーザーにロールアウトする

ロールアウトを広範な対象ユーザーに展開する前に、Copilot やその他の Search サーフェスで検証する場合は、制限付きユーザーベースにこの接続をデプロイします。制限付きロールアウトの詳細については、「段階的なロールアウト」を参照してください。

この時点で、クラウド Web サイトの接続を作成する準備ができました。 [ 作成 ] をクリックすると、Web サイトから接続とインデックス Web ページを発行できます。

アクセス許可、データ包含ルール、スキーマ、クロール頻度などのその他の設定については、Web サイトで最適な機能に基づいて既定値が設定されています。既定値は次のとおりです。

ユーザー	説明
アクセス許可	organizationのすべてのユーザーにこのコンテンツが表示されます

コンテンツ	説明
除外する URL	なし
プロパティの管理	既定のプロパティとそのスキーマをチェックするには、コンテンツに関するページを参照してください

同期	説明
増分クロール	頻度: 15 分ごと (サイトマップクロールでのみサポート)
フルクロール	頻度: 毎日

これらの値のいずれかを編集する場合は、"カスタムセットアップ" オプションを選択する必要があります。

カスタムセットアップ

カスタムセットアップでは、ユーザー、コンテンツ、同期の既定値を編集できます。

ユーザー

アクセス許可

Enterprise Websites クラウド Copilot コネクタでは、 すべてのユーザー にのみ表示される検索アクセス許可がサポートされています。インデックス付きデータは、organization内のすべてのユーザーの検索結果に表示されます。

コンテンツ

除外する URL を追加する (オプションのクロール制限)

ページがクロールされないようにするには、robots.txt ファイルでページを禁止するか、除外リストに追加する方法の 2 つの方法があります。

robots.txt のサポート

コネクタは、ルートサイトの robots.txt ファイルがあるかどうかを確認します。存在する場合は、そのファイル内の指示に従って尊重します。コネクタがサイト上の特定のページまたはディレクトリをクロールしないようにする場合は、robots.txt ファイルの "許可しない" 宣言にページまたはディレクトリを含めます。
除外する URL を追加する

必要に応じて 、除外リスト を作成して、コンテンツが機密性が高い場合やクロールする価値がない場合にクロールから一部の URL を除外できます。除外リストを作成するには、ルート URL を参照します。構成プロセス中に、除外された URL を一覧に追加できます。

サイト構成

コネクタでは、クローラーの動作をカスタマイズするための 2 つのオプションがサポートされています。

"meta" タグまたは X-Robots-Tag HTTP 応答ヘッダーに "noindex" ディレクティブを含むインデックスページ: このオプションを選択すると、クローラーは強制的にこれらのページにインデックスを付け、既定のクローラー動作をオーバーライドします。
"robots.txt" ファイルで指定された 'Allow' ディレクティブと 'Disallow' ディレクティブを無視する: このオプションを選択すると、クローラーはファイル内のクロールディレクティブを強制的に無視 robots.txt。

プロパティの管理

ここでは、Web サイトから使用可能なプロパティを追加または削除したり、プロパティにスキーマを割り当てたり (プロパティが検索可能、クエリ可能、取得可能、または絞り込み可能かどうかを定義する)、セマンティックラベルを変更してプロパティにエイリアスを追加したりできます。既定で選択されているプロパティを次に示します。

Source プロパティ	Label	説明	Schema
ブロック	ブロック	データソース内のアイテムに参加したユーザーのPeople	クエリ、取得
コンテンツ	コンテンツ	Web ページ内のすべてのテキストコンテンツ	検索
CreatedDateTime	作成日時	データソースでアイテムが作成されたデータと時刻	クエリ、取得
説明			取得、検索
FileType	ファイル拡張子	クロールされたコンテンツのファイル拡張子	クエリ、絞り込み、取得
IconURL	IconUrl	Web ページのアイコン URL	取り戻す
LastModifiedBy	最終更新者	データソース内のアイテムを最後に変更したユーザー	クエリ、取得
LastModifiedDateTime	最終更新日時	データソースでアイテムが最後に変更された日時。	クエリ、取得
タイトル	タイトル	Copilot やその他の検索エクスペリエンスに表示するアイテムのタイトル	取得、検索
URL	url	データソース内のアイテムのターゲット URL	取り戻す

Enterprise Web サイトクラウド Copilot コネクタでは、次の 2 種類のソースプロパティがサポートされています。

メタタグ

コネクタは、ルート URL に含まれる可能性があるメタタグをフェッチして表示します。クロールに含めるタグを選択できます。選択したタグは、指定されたすべての URL に対してインデックスが作成されます (使用可能な場合)。

選択したメタタグを使用して、カスタムプロパティを作成できます。また、スキーマページでは、それらをさらに管理できます (クエリ可能、検索可能、取得可能、絞り込み可能)。
カスタムプロパティの設定

インデックス付きデータをエンリッチするには、選択したメタタグまたはコネクタの既定のプロパティのカスタムプロパティを作成します。

カスタムプロパティを追加するには:
1. プロパティ名を入力します。この名前は、このコネクタの検索結果に表示されます。
2. 値の場合は、[Static] または [String/Regex Mapping]\(文字列/正規表現マッピング\) を選択します。静的な値は、このコネクタのすべての検索結果に含まれます。文字列/正規表現の値は、追加するルールによって異なります。
3. 静的な値を選択した場合は、表示する値を入力します。
4. String/rRegex 値を選択した場合:
  - [ 式の追加 ] セクションの [プロパティ ] の一覧で、一覧から既定のプロパティまたはメタタグを選択します。 [ サンプル値] に、表示される可能性のある値の種類を表す文字列を入力します。このサンプルは、ルールをプレビューするときに使用されます。 [ 式] に正規表現を入力して、検索結果に表示するプロパティ値の部分を定義します。最大 3 つの式を追加できます。
  - [ 数式の作成 ] セクションで、式から抽出された値を結合する数式を入力します。

正規表現の詳細については、「 .NET 正規表現」を参照するか、Web で正規表現式リファレンスガイドを検索してください。

同期

更新間隔は、データソースと Copilot コネクタインデックスの間でデータを同期する頻度を決定します。更新間隔には、フルクロールと増分クロールの 2 種類があります。詳細については、「更新設定」を参照してください。

必要に応じて、ここから更新間隔の既定値を変更できます。

注:

増分クロールは、サイトマップクロールオプションが選択されている場合にのみサポートされます。

トラブルシューティング

接続を発行した後、管理センターで状態 [データソース] を確認できます。更新と削除を行う方法については、「接続を監視する」をご覧ください。よく見られる問題のトラブルシューティング手順については、こちらを参照してください。

問題がある場合、またはフィードバックを提供する場合は、Microsoft Graph にお問い合わせください |サポート。