次の方法で共有


YAML と Python を使って責任ある AI テキストの分析情報を生成する (プレビュー)

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

責任ある AI (RAI) ダッシュボードには、複数の RAI ツールが 1 つのインターフェイスにまとめられており、モデルに関するデータ主導の意思決定を知らせるのに役立ちます。 自然言語処理 (NLP) モデルの理解は、表形式のデータの評価とは異なることがあります。 RAI ダッシュボード モデルのデバッグと視覚化でテキスト データがサポートされるようになりました。

責任ある AI テキスト ダッシュボードには、エラー分析、モデルの解釈可能性、不公平性の評価と軽減策の分野で成熟したいくつかの RAI ツールが用意されています。 ダッシュボードでは、情報に基づくビジネス上の意思決定を支援するために、NLP モデルの包括的な評価とデバッグがサポートされます。

この記事では、責任ある AI テキストの分析情報コンポーネントと、それをパイプライン ジョブで使用して責任ある AI テキスト ダッシュボードを生成する方法について説明します。 テキストの分析情報コンポーネントの仕様と要件、YAML および Python のコード スニペットの例を以下のセクションに示します。

重要

責任ある AI テキストの分析情報コンポーネントは、現在パブリック プレビュー段階です。 このプレビュー版はサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

責任ある AI テキストの分析情報コンポーネント

Azure Machine Learning 責任ある AI テキストの分析情報コンポーネントでは、生成された分析情報を 1 つの責任ある AI テキスト ダッシュボードに組み立てます。これは、RAI テキスト ダッシュボードの構築に使用される唯一のコア コンポーネントです。 この構築は、複数のコンポーネントを使用する表形式データの責任ある AI パイプラインとは異なります。

要件と制限

  • すべてのモデルは、Azure Machine Learning に登録する必要があります。
  • sklearn (scikit-learn) または PyTorch フレーバーと HuggingFace モデルを含む MLflow モデルがサポートされています。
  • トレーニングとテスト データセットの入力は mltable 形式である必要があります。
  • パフォーマンス上の理由から、テスト データセットは 5,000 行の視覚化 UI に制限されています。

パラメーター

責任ある AI テキストの分析情報コンポーネントでは、task_type パラメーターを使用して次のシナリオをサポートします。

名前 説明 パラメーター値
テキスト分類 特定のテキスト コンテンツに対してクラスを予測する task_type="text_classification"
複数ラベルのテキスト分類 特定のテキスト コンテンツに対して複数のクラスを予測する task_type="multilabel_text_classification"
テキストの質問応答 テキスト データセットに関する質問回答モデルを評価します task_type="question_answering"

コンポーネントでは、次のオプション パラメーターを使用できます。

パラメーター名 説明 タイプ
title ダッシュボードの簡単な説明。
classes トレーニング データセット内のクラス ラベルの完全な一覧。 文字列のリスト
maximum_rows_for_test_dataset テスト データセットで許可される行の最大数。 既定値は 5,000 です。 整数
target_column_name モデルが予測しようとしている入力データセット内の列の名前。
enable_explanation モデルの説明の生成を有効にします。 ボーリアン
enable_error_analysis モデルのエラー分析の生成を有効にします。 ボーリアン
use_model_dependency 責任ある AI 環境には、モデルの依存関係は既定では含まれません。 True に設定すると、モデルの依存関係パッケージがインストールされます。 ボーリアン
use_conda conda に設定されている場合は True を使用し、それ以外の場合は pip を使用してモデル依存関係パッケージをインストールします。 ボーリアン

ポート

責任ある AI テキストの分析情報コンポーネントには、次の 3 つの主要な入力ポートがあります。

  • 機械学習モデル
  • トレーニング データセット
  • テスト データセット

トレーニングおよびテスト データセットは同じでも問題ありません (同じでなければならないわけではありません)。 モデル入力を用意する最も簡単な方法は、モデルを登録し、責任ある AI テキストの分析情報コンポーネントの model_input ポートでその同じモデルを参照することです。

出力ポートは 2 つあります。

  • dashboard ポートには、完了した RAITextInsights オブジェクトが含まれています。
  • ux_json ポートには、最小限のダッシュボードを表示するために必要なデータが含まれています。

パイプライン ジョブ

責任ある AI テキスト ダッシュボードを作成するには、パイプラインで RAI コンポーネントを定義し、パイプライン ジョブを送信します。

次の例のように YAML ファイルのパイプラインを指定して、Azure CLI az ml job create コマンドを使用して送信できます。

  analyse_model: 
    type: command 
    component: azureml://registries/AzureML/components/rai_text_insights/versions/2 
    inputs: 
      title: From YAML  
      task_type: text_classification 
      model_input: 
        type: mlflow_model 
        path: {azureml_model_id}
      model_info: ${{{{parent.inputs.model_info}}}} 
      train_dataset: ${{{{parent.inputs.my_training_data}}}} 
      test_dataset: ${{{{parent.inputs.my_test_data}}}} 
      target_column_name: {target_column_name} 
      maximum_rows_for_test_dataset: 5000 
      classes: '[]' 
      enable_explanation: True 
      enable_error_analysis: True