この記事では、Copilot Tuning を使用して、Microsoft 365 Copilot の宣言型エージェントで使用できる、Copilot Studio で微調整されたモデルを作成する方法について説明します。 微調整は、独自のテナント データで特定のタスクの事前トレーニング済みモデルをカスタマイズできるプロセスです。 これらの微調整されたモデルを使用して、ドメイン固有のタスクの実行に精通したエージェントを構築し、Microsoft 365 Copilot で提供することができます。
微調整は、組織に関連するタスクに対するモデルのパフォーマンス向上に役立ちます。 微調整されたモデルは、固有のデータや特殊な要件を持つ組織に特に役立ちます。
この記事では、Copilot Studio の Copilot チューニング プロセスの 基本的な概要について説明 します。 組織とタスクの微調整から最良の結果を得るために役立つ、より詳細なタスク固有のガイダンスについては、「 Copilot チューニングの概要」を参照してください。
Copilot チューニングの利点
モデルの微調整は、特定のニーズに合わせて大規模な言語モデルを調整するために使用される強力な手法です。 微調整は、検索拡張生成 (RAG とも呼ばれます) やプロンプトの最適化など、他の生成 AI 最適化手法を補完します。 微調整は、モデルの動作を厳密に指示する場合に適しています。
通常、微調整を行うには、エキスパート データ サイエンティストのチームがデータセットをキュレーションし、タスク固有のデータ準備とトレーニング パイプラインを構築する必要があります。
Copilot Studio での Copilot チューニングは、このプロセスを大幅に簡素化し、あらゆる分野の専門家が使用できるツールに変換します。
Copilot Studio は、プロセスの複雑さの多くを抽象化します。 Copilot Studio Copilot チューニング プロセスはコードが少なく、複雑でリソースが多いプロジェクトから合理化されたセルフサービス エクスペリエンスに微調整を変換します。
AI を利用した自動化されたデータ準備により、ノイズの多いエンタープライズ コンテンツが最小限の労力で高品質のトレーニング セットに変わります。 この自動化により、モデルの信頼度が低い場合にのみ人間の入力を要求することで、手動でラベル付けする必要性が最小限に抑えられます。 自動化により、データのラベル付け作業を削減できます。
最後に、この機能により、特殊なデータ処理とトレーニング パイプラインを作成する手間が省けます。
安全
Copilot Tuning では、Microsoft 365 Copilot エージェントを構築するときに、既存の Microsoft Entra セキュリティ グループによって定義された適切なアクセス制御を持つユーザーのみがモデルを使用できるようにすることで、従来の微調整手法と比較してセキュリティが強化されます。 管理者は、運用環境からモデルをすばやく削除して、セキュリティをさらに強化することもできます。
トレーニング中であっても、誰もデータを見ません。 すべてのトレーニングと推論は、テナント分離環境で行われます。
Copilot Tuning で実行できるタスクの種類は何ですか?
現時点では、次のタスクに対して Copilot チューニングを使用できます。
- Q&A: エキスパートの質問と回答は、HR やプロフェッショナル サービスのシナリオなど、RAG だけでは不十分な複雑なナレッジ ドメインの質問に正確に回答できます。
- ドキュメントの生成: ドキュメント生成は、契約、コントラクト、技術ドキュメントなど、特定の形式に従う必要がある複雑で構造化されたドキュメントを作成する場合に優れています。
- ドキュメントの要約: ドキュメント要約では、規制分析や立法分析などの複雑な情報が、調整された要約に正確に蒸留されます。
合格
Copilot チューニングは、早期アクセス プログラム (EAP) です。 EAP の適格性の詳細については、「 Microsoft 365 Copilot チューニングの概要 」を参照してください。
Copilot Tuning を使用できる組織では、Microsoft 365 管理者がアクセスを制御します。 管理者は、組織またはテナント レベルの Copilot チューニングをアクティブ化できます。 管理者は、組織内の特定のユーザーに対してこの機能へのアクセスを制限することもできます。
Copilot Studio で Copilot チューニングにアクセスする
Microsoft 365 管理者がテナントで Copilot Tuning を使用できるようにし、モデル作成のアクセス許可を付与すると、Microsoft Copilot Studio で最初のモデルの構築を開始するよう招待するメールが届きます。
Copilot チューニングにアクセスするには、次の操作を行います。
Model Maker ロールを持つユーザー アカウントを使用して Copilot Studio にサインインします。
左側のナビゲーションで、3 つのドット (...) を選択し、[ Copilot チューニング] を選択します。
[Copilot チューニング] ページが開きます。
このオプションが表示されない場合は、お客様のテナントで Copilot Tuning が利用できないか、微調整モデルを作成する権限がありません。
微調整されたモデルを作成する
Copilot チューニングは、複数ステップのトレーニング プロセスです。 機械学習のトレーニング プロセスと同様に、トレーニング データの品質と量は、モデルの成功に不可欠です。
注
現在、Copilot Tuning は Sharepoint ファイルのみをサポートしており、Word 文書、PDF、テキスト ファイルに限定されています。
基本的なモデル パラメーターを構成する
まず、モデルの実行内容、動作方法、および使用する適切なデータ ソースに対して、高レベルのパラメーターを構成します。
[Copilot チューニング] ページに移動し、[新しいモデルの作成] を選択します。 [ モデルをタスク ページに合わせてカスタマイズする ] に移動します。
モデルのわかりやすい名前と説明を入力します。
組織内のユーザーが自分の作業にどのように役立つかをすばやく理解できるように、モデルについて説明します。
[ ナレッジ ソースの選択] で、[ ナレッジの追加] を選択します。
[ モデルにナレッジを追加する] ページが表示されます。
ナレッジの種類を選択します。 現在、SharePoint は使用できます。
ナレッジ ソースを選択します。 コンピューターで SharePoint ファイルを参照するか、ソースの URL を入力して、[ 追加] を選択します。
必要に応じて前の手順を繰り返して、ナレッジ ソースをさらに追加します。
ナレッジ ソースの追加が完了したら、[ 追加 ] を選択して続行します。
[ アクセス許可] で、デプロイ時にモデルにアクセスできる Microsoft Entra セキュリティ グループを指定します。
選択したセキュリティ グループがアクセスできないファイルは、Copilot Tuning によってトレーニングから自動的に除外されます。 また、Copilot Studio は、モデルに安全に組み込むことができる知識の幅を最大化するために、他のセキュリティ グループも自動的に提案します。
[ タスクの種類] で、目的のタスクの種類を選択します。
表示される [ モデル命令 ] セクションで、指示に従って質問に回答します。 指示に従って指示情報を入力します。 詳細については、Microsoft 365 Copilot Tuning ドキュメントの詳細なタスク固有のガイダンスを参照してください。
モデルの指示は、Copilot Studio がナレッジ ソースから最も関連性の高いデータを特定して準備するのに役立ちます。 適切なモデル命令は、トレーニング プロセス中にデータを解釈する方法の手掛かりをモデルに提供します。
[ 下書きの保存] を選択して進行状況を保存するか、微調整プロセスを続行する準備ができたら、[ ラベル付けデータの準備] を選択します。
Copilot Studio では、ラベル付けのデータの準備が開始されます。
選択したナレッジ ソースの一部が、選択したセキュリティ グループで使用できない場合は、Copilot Studio から通知されます。 Copilot Studio は、モデルに安全に組み込むことができる知識の幅を最大化するために、他のセキュリティ グループを自動的に提案します。
セキュリティ グループを調整して、必要に応じてカバレッジを展開し、[ 選択を続行] を選択します。
Copilot Studio は、ラベル付けのためにデータを準備します。
Von Bedeutung
データのサイズによっては、準備が完了するまでに最大 24 時間かかることがあります。 準備が行われている間は、Copilot Studio で作業を続けるか、ブラウザー タブを閉じて後で戻ることができます。 この手順が完了すると、電子メール通知が届きます。 Copilot Studio に戻り、モデル一覧を更新することで、いつでも状態を確認できます。
トレーニング サンプルにラベルを付ける
データが処理されると、Copilot Studio は、データのラベル付けの準備ができていることを示す電子メール通知を送信します。
Copilot Studio には、タスクと指定したデータに関連する生成されたトレーニング例が表示されます。 サンプルを確認し、サンプル品質に関するフィードバックを提供する必要があります。
ラベル付けは、基本的にモデルに理想的なトレーニング例を識別する方法を教えるので、重要なステップです。 ドメインの専門知識を持つ個人がこのタスクを実行していることを確認します。 ドメインの専門家でない場合は、組み込みのラベル付け管理ワークフローを使用して、ラベル付けタスクを対象の専門家に委任できます。
ラベル付けプロセスは、通常、複数のバッチを経由します。 モデルのトレーニングには、最大 4 ~ 5 つのバッチのラベルが必要な場合があります。
ラベル付けが完了したら、モデルをトレーニングする準備ができました。 [ トレーニングの開始] を選択して続行します。
モデルをトレーニングする
Copilot Studio では、ラベル付けされたデータを使用してモデルをトレーニングします。 トレーニングは完全に自動化されたプロセスであり、それ以上の入力は必要ありません。
Von Bedeutung
データのサイズによっては、トレーニング プロセスに最大 24 時間かかることがあります。
トレーニングが完了すると、電子メール通知が届きます。 Copilot Studio に戻り、モデル一覧を更新することで、いつでも状態を確認することもできます。
モデルを評価する
最後のフェーズでは、微調整されたモデル出力の結果とベースラインの微調整されていないモデルの結果との間で、一連の比較を行います。 モデルの応答の品質を引き続き向上させる場合は、新しいモデル トレーニングの実行を開始できます。
次のトレーニング実行でモデルの出力を向上させるには、データセットがモデルの特定のタスクに適切に揃っており、データにドメイン エキスパートによってラベルが付けられていることを確認します。
モデルを Microsoft 365 Copilot に発行する
モデルの出力に問題がなければ、モデルを Microsoft 365 テナント カタログに発行します。
これで、Copilot のテナントのエージェントがモデルを使用できるようになりました。
注
微調整プロセスの開始時に選択したセキュリティ グループのメンバーのみが、エージェントでモデルを使用できます。
Copilot のエージェントでモデルを使用する方法の詳細については、Microsoft 365 Copilot のドキュメントを参照してください。
制限事項と制約事項
微調整されたモデルを作成する際に注意すべきいくつかの制限事項と制限があります。
- モデルのトレーニング後にナレッジ ソースを追加する場合は、微調整プロセスを最初から再開する必要があります。
- Copilot Studio では、モデルのバージョン管理はまだサポートされていません。
- モデルのトレーニングでデータが使用されているユーザーが、GDPR (または同様の規制) に基づく有効な削除要求を送信する場合は、モデルを再トレーニングする必要があります。
- モデルを微調整すると、トレーニング データに基づいてモデルの重みが調整されます。 微調整されたモデルはいつでも削除できます。
- テナント環境内でデータを収集、格納、および使用する方法については、お客様が責任を負います。
- データ プラクティスが、透明性、同意、アクセス、削除に関する法的要件を満たしていることを確認する必要があります。
- 使用する前に、このシステムから生成された出力の正確性、妥当性、コンプライアンスを確認する責任があります。 検証には、主題の専門家による確認が必要な場合があります。