エンティティの抽出

完了

固有表現認識では、テキストで言及されているエンティティを識別します。 エンティティは、次に示すようなカテゴリとサブカテゴリに分類されます。

  • Person
  • Location
  • DateTime
  • Organization
  • Address
  • 電子メール
  • URL

Note

カテゴリの完全な一覧については、Azure AI Language のドキュメントをご覧ください。

エンティティ認識の入力は、他の Azure AI Language API 関数の入力と似ています。

{
  "documents": [
    {
      "language": "en",
      "id": "1",
      "text": "Joe went to London on Saturday"
    }
  ]
}

応答には、各ドキュメントで見つかった分類済みのエンティティの一覧が含まれています。

{
  "documents":[
      {
          "id":"1",
          "entities":[
          {
            "text":"Joe",
            "category":"Person",
            "offset":0,
            "length":3,
            "confidenceScore":0.62
          },
          {
            "text":"London",
            "category":"Location",
            "subcategory":"GPE",
            "offset":12,
            "length":6,
            "confidenceScore":0.88
          },
          {
            "text":"Saturday",
            "category":"DateTime",
            "subcategory":"Date",
            "offset":22,
            "length":8,
            "confidenceScore":0.8
          }
        ],
        "warnings":[]
      }
  ],
  "errors":[],
  "modelVersion":"2021-01-15"
}