Condividi tramite


Espressioni

Importante

LUIS verrà ritirato il 1 ottobre 2025 e a partire dal 1 aprile 2023 non è più possibile creare nuove risorse LUIS. È consigliabile eseguire la migrazione delle applicazioni LUIS a comprensione del linguaggio di conversazione (CLU) per trarre vantaggio dal supporto continuo del prodotto e dalle funzionalità multilingua.

Le espressioni sono gli input dell'utente che l'app ha bisogno di interpretare. Per insegnare a LUIS a estrarre le finalità e le entità da tali input, è importante acquisire una varietà di espressioni di esempio diverse per ogni finalità. L'apprendimento attivo, o processo di training continuativo di nuove espressioni, è fondamentale per l'intelligenza di Machine Learning offerta da LUIS.

Raccogliere le espressioni che si ritiene verranno immesse dagli utenti. Includere espressioni che hanno lo stesso significato ma vengono costruite in modi diversi:

  • Lunghezza dell'espressione - breve, media e lunga per l'applicazione client
  • Lunghezza della parola e della frase
  • Posizione della parola - entità all'inizio, nel mezzo e alla fine dell'espressione
  • Grammatica
  • Pluralizzazione
  • Stemming
  • Scelta di sostantivo e verbo
  • Punteggiatura: uso delle forme grammaticali sia corrette che errate

Come scegliere espressioni diversificate

Quando si inizia ad aggiungere espressioni di esempio al modello LUIS, è necessario tenere presenti diversi principi:

Le espressioni non sono sempre ben formate

L'app potrebbe dover elaborare frasi, ad esempio "Prenota un biglietto per Parigi per me" o un frammento di frase, ad esempio "Prenotazione" o "Volo Parigi". Gli utenti spesso commettono errori ortografici. Quando si pianifica l'app, valutare se eseguire il Controllo ortografico Bing o meno sull'input dell'utente prima di passarlo a LUIS.

Se non si esegue il controllo ortografico sulle espressioni dell'utente, è necessario formare LUIS sulle espressioni che includono errori di digitazione e di ortografia.

Usare il linguaggio rappresentativo dell'utente

Quando si scelgono le espressioni, tenere presente che quelli che si ritengono essere termini o frasi comuni potrebbero non essere corretti per l'utente tipico dell'applicazione client. Gli utenti potrebbero non avere esperienza del dominio o usare una terminologia diversa. Fare attenzione quando si usano termini o frasi che l'utente pronuncerebbe solo se fosse esperto.

Scegliere terminologia e formulazioni diverse

Si noterà che, anche se si fanno sforzi per creare una modelli di frase alternativi, alcuni termini verranno comunque ripetuti. Ad esempio, le espressioni seguenti hanno un significato simile, ma terminologia e formulazione diverse:

  • "Come mi procuro un computer?"
  • "Dove posso trovare un computer?"
  • "Vorrei un computer, dove posso trovarlo?"
  • "Quando posso avere un computer?"

In questo caso, non vengono usate alternative per il termine fondamentale computer. Usare alternative quali computer desktop, portatile, workstation o anche solo macchina. LUIS è in grado di dedurre in modo intelligente i sinonimi dal contesto, ma quando vengono create espressioni per il training, è sempre preferibile variare.

Espressioni di esempio in ogni finalità

Ogni finalità deve avere almeno 15 espressioni di esempio. Se la finalità non prevede espressioni di esempio, non sarà possibile formare LUIS. Se una finalità contiene una o qualche espressione di esempio, LUIS potrebbe non essere in grado di prevederla con precisione.

Aggiungere piccoli gruppi di espressioni

Ogni volta che si esegue l'iterazione del modello per migliorarlo, non aggiungere grandi quantità di espressioni. Valutare l'aggiunta di espressioni in gruppi di 15. Quindi selezionare Forma, Pubblica e Testa.

LUIS compila modelli efficaci con espressioni selezionate con attenzione dall'autore del modello LUIS. L'aggiunta di un numero eccessivo di espressioni non è utile perché introduce confusione.

È consigliabile iniziare con poche espressioni, poi esaminare le espressioni dell'endpoint per prevederne correttamente la finalità e per estrarre l'entità.

Normalizzazione delle espressioni

La normalizzazione delle espressioni è il processo che consiste nell'ignorare gli effetti dei tipi di testo, ad esempio punteggiatura e segni diacritici, durante il training e la stima.

Le impostazioni di normalizzazione delle espressioni vengono disattivate per impostazione predefinita. Queste impostazioni includono:

  • Moduli di parole
  • Segni diacritici
  • Punteggiatura

Se si attiva un'impostazione di normalizzazione, i punteggi nel riquadro Test, i test in batch e le query degli endpoint cambieranno per tutte le espressioni per tale impostazione di normalizzazione.

Quando si clona una versione nel portale LUIS, le impostazioni della versione vengono mantenute nella nuova versione clonata.

Impostare le impostazioni della versione dell'app usando il portale LUIS selezionando Gestisci dal menu di navigazione in alto, nella pagina Impostazioni applicazione. È anche possibile usare Aggiorna l'API delle impostazioni della versione. Per altre informazioni, vedere la documentazione di riferimento.

Moduli di parole

La normalizzazione dei moduli di parole ignora le differenze nelle parole che si espandono oltre la radice.

Segni diacritici

I segni diacritici sono segni o simboli all'interno del testo, ad esempio:

İ ı Ş Ğ ş ğ ö ü

Segni di punteggiatura

Quando si normalizza la punteggiatura, la punteggiatura verrà rimossa dalle espressioni prima di procedere al training dei modelli e alla previsione delle query dell'endpoint.

Punteggiatura è un token separato in LUIS. Un'espressione che contiene un punto alla fine è un'espressione separata da una che non contiene un punto alla fine e può ottenere due stime diverse.

Se la punteggiatura è normalizzata, LUIS non ignora i segni di punteggiatura per impostazione predefinita, in quanto alcune applicazioni client possono attribuire significato a questi segni. Assicurarsi di includere le espressioni di esempio che usino sia lo stile con punteggiatura sia quello senza punteggiatura, in modo che entrambi gli stili restituiscano gli stessi punteggi relativi.

Verificare che il modello gestisca la punteggiatura nelle espressioni di esempio (con e senza punteggiatura) o nei criteri dove risulta più semplice ignorare la punteggiatura. Ad esempio: Mi sto candidando per la posizione di {Job}[.]

Se la punteggiatura non ha alcun significato specifico nell'applicazione client, valutare la possibilità di ignorare i segni di punteggiatura normalizzando la punteggiatura.

Ignorare parole e punteggiatura

Se si desidera che vengano ignorati parole o segni di punteggiatura specifici nell'espressione di esempio, usare un criterio con la sintassi ignora per le parentesi quadre, [].

Training con tutte le espressioni

Il training non è deterministico: la previsione delle espressioni potrebbe variare leggermente a seconda delle versioni o delle app. È possibile rimuovere il training non deterministico aggiornando l'API delleimpostazioni della versione con la coppia nome/valore UseAllTrainingData in modo da usare tutti i dati di training.

Eseguire il test delle espressioni

Gli sviluppatori devono iniziare il test dell'applicazione LUIS con dati reali inviando espressioni all'URL dell'endpoint di stima. Queste espressioni vengono usate per migliorare le prestazioni di finalità ed entità con l'esame delle espressioni. I test inviati usando il riquadro di test del portale LUIS non vengono trasmessi attraverso l'endpoint e pertanto non contribuiscono all'apprendimento attivo.

Esaminare le espressioni

Dopo che il modello è stato formato e pubblicato e dopo aver ricevuto le query dell'endpoint, esaminare le espressioni inviate da LUIS. LUIS seleziona le espressioni dell'endpoint con punteggi bassi in termini di finalità o entità.

Procedure consigliate

Assegnare etichette per il significato delle parole

Se la scelta o la disposizione della parola è la stessa ma il significato è diverso, non etichettarla con le entità.

Nelle espressioni seguenti, la parola tirare è un omografo, il che significa che è scritto lo stesso ma ha un significato diverso:

  • "Quali sono le fiere in programma nell'area di Seattle la prossima estate?"
  • "Hanno sorpreso un vandalo a tirare pietre"

Se si desidera che un'entità di evento trovi tutti i dati dell'evento, etichettare la parola tirare nella prima espressione, ma non nella seconda.

Non ignorare le possibili varianti di espressione

LUIS prevede variazioni nelle espressioni di una finalità. Le espressioni possono variare mantenendo lo stesso significato generale. Le variazioni possono includere lunghezza dell'espressione, scelta e posizionamento delle parole.

Non usare lo stesso formato Usare formati diversi
Acquista un biglietto per Seattle Acquista 1 biglietto per Seattle
Acquista un biglietto per Parigi Prenota due biglietti sul red eye per Parigi lunedì prossimo
Acquista un biglietto per Orlando Desidero prenotare 3 biglietti per Orlando per le vacanze di primavera

La seconda colonna usa verbi diversi (acquista, prenota, riserva), quantità diverse (1, &"due", 3) e disposizioni diverse delle parole, ma tutti hanno la stessa intenzione di acquistare biglietti aerei.

Non aggiungere troppe espressioni di esempio alle finalità

Dopo la pubblicazione dell'app, aggiungere solo le espressioni dall'apprendimento attivo nel processo del ciclo di vita dello sviluppo. Se le espressioni sono troppo simili, aggiungere un criterio.

Passaggi successivi