實體連結認知技能 (v3)

實體連結 技能 (v3) 會 傳回已辨識的實體清單,其中包含已知知識庫 (Wikipedia) 中文章的連結。

注意

此技能會系結至 Azure AI 語言 中的 實體連結 機器學習模型,而且需要 每天超過 20 份檔的交易計費資源 。 內建技能的執行會以現有的 Azure AI 服務隨用隨付價格 收費。

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

資料限制

記錄的大小上限應為 50,000 個字元,如 所 String.Length 測量。 如果您需要在將資料傳送至 EntityLinking 技能之前中斷資料,請考慮使用 文字分割技能 。 如果您使用文字分割技能,請將頁面長度設定為 5000 以獲得最佳效能。

技能參數

參數名稱會區分大小寫,而且都是選擇性的。

參數名稱 描述
defaultLanguageCode 輸入文字的語言代碼。 如果未指定預設語言代碼,則會使用英文 (en) 作為預設語言代碼。
查看支援語言的完整清單。
minimumPrecision 介於 0 和 1 之間的值。 如果信賴分數 (在輸出中 entities ) 低於此值,則不會傳回實體。 預設值是 0。
modelVersion (選擇性)指定 呼叫實體連結時要使用的模型 版本。 如果未指定,則會預設為最新的可用。 除非有必要,否則建議您不要指定此值。

技能輸入

輸入名稱 描述
languageCode 字串,表示記錄的語言。 如果未指定此參數,則會使用預設語言程式碼來分析記錄。
查看支援語言的完整清單。
text 要分析的文字。

技能輸出

輸出名稱 描述
entities 包含下欄欄位的複雜型別陣列:
  • "name" (文字中顯示的實際機構名稱)
  • "id"
  • "language" (技能決定的文字語言)
  • "url" (此實體的連結 URL)
  • bingId 」 (此連結實體的 bingId)
  • "dataSource" (與 URL 相關聯的資料來源)
  • "matches" (複雜型別的陣列,其中包含: textoffsetlengthconfidenceScore

範例定義

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

範例輸入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

範例輸出

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

此技能輸出中實體傳回的位移會直接從 語言服務 API 傳回,這表示如果您使用它們來編制原始字串的索引,則應該使用 .NET 中的 StringInfo 類別來擷取正確的內容。 如需詳細資訊,請參閱 語言服務功能 中的多語系和表情符號支援。

警告案例

如果不支援檔的語言代碼,則會傳回警告,而且不會擷取任何實體。

另請參閱