Condividi tramite


Competenza Estrazione frasi chiave della ricerca cognitiva

La competenza Estrazione frasi chiave valuta il testo non strutturato e restituisce un elenco di frasi chiave per ciascun record. Questa competenza usa i modelli di Machine Learning frasi chiave forniti dal linguaggio di intelligenza artificiale di Azure.

Questa funzionalità è utile se occorre identificare rapidamente i punti di discussione principali nel record. Ad esempio, dato il testo di input "Il cibo era delizioso e il personale era meraviglioso", il servizio restituisce "cibo" e "personale meraviglioso".

Nota

Questa competenza è associata ai servizi di intelligenza artificiale di Azure e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione di competenze predefinite viene addebitata al prezzo con pagamento in base al consumo dei servizi di intelligenza artificiale di Azure esistente.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Limiti dei dati

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli all'estrattore di frasi chiave, è possibile usare la competenza Divisione del testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5000 per ottenere prestazioni ottimali.

Parametri della competenza

I parametri fanno distinzione tra maiuscole e minuscole.

Input Descrizione
defaultLanguageCode (Facoltativo) Il codice lingua da applicare ai documenti che non specificano in modo esplicito una lingua. Se il codice di lingua predefinito non è specificato, l'inglese (en) viene usato come codice di lingua predefinito.
Vedi l'elenco completo di linguaggi supportati.
maxKeyPhraseCount (Facoltativo) Il numero massimo di frasi chiave da produrre.
modelVersion (Facoltativo) Specifica la versione del modello da usare quando si chiama l'API della frase chiave. Per impostazione predefinita, la versione più recente disponibile quando non è specificata. È consigliabile non specificare questo valore a meno che non sia necessario.

Input competenze

Input Descrizione
text Testo da analizzare.
languageCode Stringa che indica la lingua dei record. Se questo parametro non viene specificato, il codice di lingua predefinito viene usato per analizzare i record.
Vedi l'elenco completo di linguaggi supportati.

Output competenze

Output Descrizione
keyPhrases Elenco di frasi chiave estratte dal testo di input. Le frasi chiave vengono restituite in ordine di importanza.

Definizione di esempio

Si consideri un record SQL con i campi seguenti:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

La definizione della competenza potrebbe quindi essere simile alla seguente:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Output di esempio

Per l'esempio precedente, l'output della competenza viene scritto in un nuovo nodo nell'albero arricchito denominato "document/myKeyPhrases" perché è quello targetName specificato. Se non si specifica un oggetto targetName, sarà "document/keyPhrases".

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

È possibile usare "document/myKeyPhrases" come input in altre competenze o come origine di un mapping dei campi di output.

Avvisi

Se si specifica un codice linguistico non supportato, viene generato un avviso e le frasi chiave non vengono estratte. Se il testo è vuoto, viene generato un avviso. Se il testo è maggiore di 50.000 caratteri, vengono analizzati solo i primi 50.000 caratteri e viene generato un avviso.

Vedi anche