次の方法で共有


Edge RAG Preview システムを評価する

Azure Arc で有効になっている Edge RAG プレビュー内のシステム、モデル、データセットを評価します。評価には、ベースラインと自動の 2 種類があります。

Von Bedeutung

Azure Arc で有効になっている Edge RAG プレビューは、現在プレビュー段階です。 ベータ版、プレビュー版、または一般提供としてまだリリースされていない Azure の機能に適用される法律条項については、「Microsoft Azure プレビューの追加使用条件」を参照してください。

[前提条件]

開始する前に、次の手順を実行します。

ベースライン チェックの実行

ベースライン チェックでは、RAG システムの機能が評価され、期待どおりに動作していることを確認します。 次のタスクが実行されます。

  • ドキュメント データセットにインジェスト ビルドを作成します。
  • 一連のクエリと予想される回答を含むテスト データセットのビルドを使用した推論。
  • モデル メトリックに基づいてシステムを評価します。

ベースライン チェックを実行するには:

  1. デプロイとアプリの登録時に指定されたドメイン名を使用して、開発者ポータルに移動します。 たとえば、 https://arcrag.contoso.comと指定します。

  2. "EdgeRAGDeveloper" ロールと "EdgeRAGEndUser" ロールの両方が割り当てられている開発者資格情報でサインインします。

  3. [ 評価 ] タブを選択します。

    開発者ポータルの [評価] タブを示すスクリーンショット。チェックを実行して評価を管理するためのオプションが強調表示されています。

  4. [ 基準計画チェック ] タブで、[ チェックの実行] を選択します。

  5. 評価名を入力してください。

    開発者ポータルの [評価] タブを示すスクリーンショット。チェックを実行して評価を管理するためのオプションが表示されています。

  6. [実行] を選択します。

  7. 評価の状態を確認します。

    開発者ポータルの評価状態ページを示すスクリーンショット。ベースライン チェックの進行状況と詳細が表示されています。

  8. 評価が完了したら、名前を選択して結果を表示します。

    評価結果を示すスクリーンショット。RAG システムのメトリックと詳細なパフォーマンス分析が含まれます。

自動評価を実行する

自動評価では、独自のドキュメントとデータセットを使用して RAG システムの品質が評価されます。

  1. 開発者ポータルで、 評価>自動評価を選択します。

    開発者ポータルの [自動評価] タブのスクリーンショット。評価を作成するためのオプションがあります。

  2. [ 自動評価の作成] を選択します。

  3. 評価名を入力してください。

    [基本情報] タブのスクリーンショット。評価名と構成オプションを入力するためのフィールドが表示されています。

  4. TemperatureTop-N、Top-PSystem prompt などのパラメーターを確認します。 これらのパラメーターは、 チャットプレイグラウンドから派生します。 パラメーターを変更するには、[ チャット ] タブに移動し、必要に応じて変更します。

  5. [次へ] を選択します。

  6. [テスト データセット] で、[データセット サンプルのダウンロード] を選択して、テスト データセット JSONL 形式の必要な構造を理解します。

    テンプレートをダウンロードしてデータセットを更新できる [テスト データセット] タブのスクリーンショット。

  7. データセットの JSONL ファイルをアップロードします。

  8. [次へ] を選択します。

  9. RAG システムに対して評価するメトリックを選択します。

    システムを評価するために使用可能なメトリックを示すスクリーンショット。

  10. [次へ] を選択します。

  11. 構成を確認し、[ 作成] を選択します。

    自動評価の構成をまとめたタブのスクリーンショット。

  12. 評価の進行状況と状態を監視します。

    メトリックと評価の詳細を含む、自動評価の結果を示すスクリーンショット。

  13. 評価が完了したら、評価名を選択して結果を確認します。

    開発者ポータルの評価結果ページのスクリーンショット。RAG システムのメトリックとパフォーマンス分析が表示されています。

  14. 評価の詳細とメトリックを確認します。

    RAG システムのメトリック、構成、詳細分析を示す、開発者ポータルの評価の詳細ページのスクリーンショット。