YAML と Python を使って責任ある AI テキストの分析情報を生成する (プレビュー)

2024-09-03

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

責任ある AI (RAI) ダッシュボードには、複数の RAI ツールが 1 つのインターフェイスにまとめられており、モデルに関するデータ主導の意思決定を知らせるのに役立ちます。自然言語処理 (NLP) モデルの理解は、表形式のデータの評価とは異なることがあります。 RAI ダッシュボードモデルのデバッグと視覚化でテキストデータがサポートされるようになりました。

責任ある AI テキストダッシュボードには、エラー分析、モデルの解釈可能性、不公平性の評価と軽減策の分野で成熟したいくつかの RAI ツールが用意されています。ダッシュボードでは、情報に基づくビジネス上の意思決定を支援するために、NLP モデルの包括的な評価とデバッグがサポートされます。

この記事では、責任ある AI テキストの分析情報コンポーネントと、それをパイプラインジョブで使用して責任ある AI テキストダッシュボードを生成する方法について説明します。テキストの分析情報コンポーネントの仕様と要件、YAML および Python のコードスニペットの例を以下のセクションに示します。

重要

責任ある AI テキストの分析情報コンポーネントは、現在パブリックプレビュー段階です。このプレビュー版はサービスレベルアグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

責任ある AI テキストの分析情報コンポーネント

Azure Machine Learning 責任ある AI テキストの分析情報コンポーネントでは、生成された分析情報を 1 つの責任ある AI テキストダッシュボードに組み立てます。これは、RAI テキストダッシュボードの構築に使用される唯一のコアコンポーネントです。この構築は、複数のコンポーネントを使用する表形式データの責任ある AI パイプラインとは異なります。

要件と制限

すべてのモデルは、Azure Machine Learning に登録する必要があります。
sklearn (scikit-learn) または PyTorch フレーバーと HuggingFace モデルを含む MLflow モデルがサポートされています。
トレーニングとテストデータセットの入力は mltable 形式である必要があります。
パフォーマンス上の理由から、テストデータセットは 5,000 行の視覚化 UI に制限されています。

パラメーター

責任ある AI テキストの分析情報コンポーネントでは、task_type パラメーターを使用して次のシナリオをサポートします。

名前	説明	パラメーター値
テキスト分類	特定のテキストコンテンツに対してクラスを予測する	`task_type="text_classification"`
複数ラベルのテキスト分類	特定のテキストコンテンツに対して複数のクラスを予測する	`task_type="multilabel_text_classification"`
テキストの質問応答	テキストデータセットに関する質問回答モデルを評価します	`task_type="question_answering"`

コンポーネントでは、次のオプションパラメーターを使用できます。

パラメーター名	説明	タイプ
`title`	ダッシュボードの簡単な説明。	糸
`classes`	トレーニングデータセット内のクラスラベルの完全な一覧。	文字列のリスト
`maximum_rows_for_test_dataset`	テストデータセットで許可される行の最大数。既定値は 5,000 です。	整数
`target_column_name`	モデルが予測しようとしている入力データセット内の列の名前。	糸
`enable_explanation`	モデルの説明の生成を有効にします。	ボーリアン
`enable_error_analysis`	モデルのエラー分析の生成を有効にします。	ボーリアン
`use_model_dependency`	責任ある AI 環境には、モデルの依存関係は既定では含まれません。 `True` に設定すると、モデルの依存関係パッケージがインストールされます。	ボーリアン
`use_conda`	`conda` に設定されている場合は `True` を使用し、それ以外の場合は `pip` を使用してモデル依存関係パッケージをインストールします。	ボーリアン

ポート

責任ある AI テキストの分析情報コンポーネントには、次の 3 つの主要な入力ポートがあります。

機械学習モデル
トレーニングデータセット
テストデータセット

トレーニングおよびテストデータセットは同じでも問題ありません (同じでなければならないわけではありません)。モデル入力を用意する最も簡単な方法は、モデルを登録し、責任ある AI テキストの分析情報コンポーネントの model_input ポートでその同じモデルを参照することです。

出力ポートは 2 つあります。

dashboard ポートには、完了した RAITextInsights オブジェクトが含まれています。
ux_json ポートには、最小限のダッシュボードを表示するために必要なデータが含まれています。

パイプラインジョブ

責任ある AI テキストダッシュボードを作成するには、パイプラインで RAI コンポーネントを定義し、パイプラインジョブを送信します。

YAML
Python SDK

次の例のように YAML ファイルのパイプラインを指定して、Azure CLI az ml job create コマンドを使用して送信できます。

  analyse_model: 
    type: command 
    component: azureml://registries/AzureML/components/rai_text_insights/versions/2 
    inputs: 
      title: From YAML  
      task_type: text_classification 
      model_input: 
        type: mlflow_model 
        path: {azureml_model_id}
      model_info: ${{{{parent.inputs.model_info}}}} 
      train_dataset: ${{{{parent.inputs.my_training_data}}}} 
      test_dataset: ${{{{parent.inputs.my_test_data}}}} 
      target_column_name: {target_column_name} 
      maximum_rows_for_test_dataset: 5000 
      classes: '[]' 
      enable_explanation: True 
      enable_error_analysis: True

責任ある AI テキストダッシュボードでは、Python 用の責任ある AI テキスト SDK が使用されます。

Python スクリプトで、RAI テキストの分析情報コンポーネントを読み込みます。

rai_text_insights_component = ml_client_registry.components.get( 
    name="rai_text_insights", version=version_string 
)

パイプライン内で、次の例のように RAI テキストの分析情報を開始します。

        rai_text_job = rai_text_insights_component( 
            title="From Python", 
            task_type="text_classification", 
            model_info=expected_model_id, 
            model_input=Input(type=AssetTypes.MLFLOW_MODEL, path= azureml_model_id), 
            train_dataset=train_data, 
            test_dataset=test_data, 
            target_column_name=target_column_name, 
            classes=classes, 
        )

出力を組み立てます。

        rai_text_job.outputs.dashboard.mode = "upload" 
        rai_text_job.outputs.ux_json.mode = "upload"

責任ある AI テキストダッシュボードを使用する方法を確認します。
責任ある AI ダッシュボードの背後にある概念と手法の詳細について確認します。
責任ある AI ダッシュボードを生成するには、サンプルの YAML と Python のノートブックを参照してください。

次の方法で共有

YAML と Python を使って責任ある AI テキストの分析情報を生成する (プレビュー)

責任ある AI テキストの分析情報コンポーネント

要件と制限

パラメーター

ポート

パイプライン ジョブ

関連するコンテンツ

フィードバック

その他のリソース

パイプラインジョブ