キーワード 抽出認知スキル

キーフレーズ抽出スキルは非構造化テキストを評価し、各レコードに対してキーフレーズのリストを返します。 このスキルは、Foundry Toolsが提供するAzure Language in Foundry Tools/c1が提供するKey Phrase機械学習モデルを使用します。

この機能は、記録内の主要な話題を素早く特定したい場合に役立ちます。 例えば、「料理は美味しかったし、スタッフも素晴らしかった」という入力テキストが出ると、サービスは「food」と「wonderful staff」を返します。

Note

このスキルはFoundry Toolsに縛られており、1日あたり1インデクサーあたり20件を超える取引に対して 請求可能なリソースが必要です 。 組み込みスキルの実行は、既存の Foundry Tools Standard 価格で課金されます。

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Data limits

レコードの最大サイズは String.Lengthで測定した50,000文字であるべきです。 キーワード抽出器に送る前にデータを分割する必要がある場合は、 Text Splitスキルの使用を検討してください。 テキスト分割スキルを使う場合は、ページ長を5000に設定して最高のパフォーマンスを図りましょう。

Skill parameters

パラメーターでは大文字と小文字が区別されます。

Inputs Description
defaultLanguageCode (任意)言語コードを明示的に指定しない文書に適用される言語コード。 デフォルトの言語コードが指定されていない場合は、英語(en)がデフォルトの言語コードとして使われます。
サポートされている言語の全リストをご覧ください。
maxKeyPhraseCount (任意)作成すべき最大数のキーワードフレーズ。
modelVersion (任意)キーフレーズAPIを呼び出す際に使用する モデルのバージョン を指定します。 指定されていない場合は、最新の利用可能なものをデフォルトで表示します。 必要でない限り、この値を指定しないことをおすすめします。

Skill inputs

Input Description
text 分析すべきテキスト。
languageCode 記録の言語を示す文字列。 このパラメータが指定されていない場合は、デフォルトの言語コードを使ってレコードを解析します。
サポートされている言語の全リストをご覧ください。

Skill outputs

Output Description
keyPhrases 入力テキストから抽出されたキーワードフレーズのリスト。 重要なフレーズは重要度の順に返されます。

Sample definition

以下のフィールドを持つSQLレコードを考えます:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

それなら、あなたのスキル定義はこんな感じになるかもしれません:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Sample output

前の例では、スキルの出力は「document/myKeyPhrases」という新しいノードに書き込まれています。これは私たちが指定した targetName です。 targetNameを指定しなければ、「ドキュメント/キーフレーズ」と書かれます。

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

「document/myKeyPhrases」は他のスキルの入力として使ったり、 出力フィールドマッピングのソースとして使うことができます。

Warnings

サポートされていない言語コードを提供した場合、警告が生成され、キーフレーズは抽出されません。 テキストが空の場合は警告が表示されます。 テキストが50,000文字を超える場合は、最初の50,000文字のみが分析され、警告が出されます。

See also