次の方法で共有


名前付きエンティティの認識コグニティブ スキル (v2)

名前付きエンティティ認識 スキル (v2) は、テキストから名前付きエンティティを抽出します。 使用可能なエンティティ タイプには、personlocationorganization が含まれます。

重要

名前付きエンティティの認識スキル (V2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) は廃止となり、Microsoft.Skills.Text.V3.EntityRecognitionSkill に置き換えられました。 非推奨の Azure AI Search スキルに関するページに記載されている推奨事項に従い、サポートされているスキルに移行してください。

Note

処理の頻度を増やす、ドキュメントを追加する、または AI アルゴリズムを追加することによってスコープを拡大する場合は、課金対象の Azure AI サービス リソースをアタッチする必要があります。 Azure AI サービスの API を呼び出すとき、および Azure AI Search のドキュメント解析段階の一部として画像抽出するときに、料金が発生します。 ドキュメントからのテキストの抽出には、料金はかかりません。 組み込みスキルの実行は、既存の Azure AI サービスの従量課金制の価格で課金されます。

画像抽出は、料金ページに説明されているように、Azure AI Search によって追加で従量課金されます。 テキスト抽出は無料です。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

データ制限

レコードのサイズは、String.Length で測定して 50,000 文字以下にする必要があります。 データをキー フレーズ エクストラクターに送信する前に分割する必要がある場合は、テキスト分割スキルの使用を検討してください。 テキスト分割スキルを使用する場合は、最適なパフォーマンスを得るためにページの長さを 5000 に設定します。

スキルのパラメーター

パラメーターの大文字と小文字は区別されます。

パラメーター名 説明
categories 抽出する必要があるカテゴリの配列。 可能なカテゴリの型は、"Person""Location""Organization" です。 カテゴリが指定されていない場合、すべての型が返されます。
defaultLanguageCode 入力テキストの言語コード。 次の言語がサポートされます。de, en, es, fr, it
minimumPrecision 0 から 1 の範囲の数。 精度がこの値よりも小さい場合は、エンティティは返されません。 既定値は 0 です。

スキルの入力

入力名 説明
languageCode 省略可能。 既定値は "en" です。
text 分析対象テキストです。

スキルの出力

出力名 説明
個人 各文字列が人物の名前を表す文字列の配列。
場所 各文字列が場所を表す文字列の配列。
組織 各文字列が組織を表す文字列の配列。
エンティティ 複合型の配列。 各複合型には、次のフィールドが含まれます。
  • category ("person""organization"、または "location")
  • value (実際のエンティティ名)
  • offset (テキスト内で見つかった場所)
  • confidence (値が実際のエンティティの信頼度を表す 0 から 1 の値)

定義例

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

サンプル入力

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

サンプル出力

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

警告のケース

ドキュメントの言語コードがサポートされていない場合、警告が返され、エンティティは抽出されません。

関連項目