Punteggio di attendibilità

2025-06-04

Quando una query utente viene confrontata con un progetto (noto anche come knowledge base), la risposta alle domande personalizzate restituisce risposte pertinenti, insieme a un punteggio di attendibilità. Questo punteggio indica la probabilità che la risposta corrisponda perfettamente alla query dell'utente specificata.

Il punteggio di attendibilità è un numero compreso tra 0 e 100. Un punteggio pari a 100 indica probabilmente una corrispondenza esatta, mentre un punteggio pari a 0 indica che non è stata trovata alcuna risposta corrispondente. Maggiore sarà il punteggio, maggiore sarà l'attendibilità della risposta. Per una determinata query potrebbero essere restituite più risposte. In questo caso le risposte sono restituite in ordine decrescente in base al punteggio di attendibilità.

La tabella seguente indica l'attendibilità tipica associata a un determinato punteggio.

Valore del punteggio	Significato del punteggio	Query di esempio
0.90 - 1.00	Corrispondenza quasi esatta tra query dell'utente e domanda della knowledge base
> 0,70	Attendibilità elevata: in genere una risposta appropriata che risponde completamente alla query dell'utente
0.50 - 0.70	Attendibilità media: in genere una risposta piuttosto appropriata che dovrebbe rispondere alla finalità principale della query dell'utente
0.30 - 0.50	Attendibilità bassa: in genere una risposta correlata che risponde parzialmente alla finalità dell'utente
< 0.30	Attendibilità molto bassa: in genere non risponde alla query dell'utente, ma include alcune parole o frasi corrispondenti
0	Nessuna corrispondenza, perciò non viene restituita alcuna risposta.

Scegliere un punteggio soglia

La tabella precedente mostra l'intervallo di punteggi che possono verificarsi durante l'esecuzione di query con la risposta alle domande personalizzate. Tuttavia, poiché ogni progetto è diverso e presenta tipi di parole, finalità e obiettivi differenti, è consigliabile eseguire i test necessari e scegliere la soglia più adatta. Per impostazione predefinita, la soglia è impostata su 0, in modo che vengano restituite tutte le risposte possibili. La soglia consigliata che dovrebbe funzionare per la maggior parte dei progetti è 50.

Quando si sceglie la soglia, tenere presente il bilanciamento tra Accuratezza e Copertura e modificare la soglia secondo necessità.

Quando Accuracy (Precisione) è più importante, aumentare la soglia. In questo modo, ogni volta che una risposta viene restituita, essa sarà molto più ATTENDIBILE e avrà una probabilità molto maggiore di essere quella che l'utente sta cercando. In questo modo molte domande potrebbero rimanere senza risposta.
Se Coverage (Attinenza) è più importante e si desidera rispondere al massimo numero di domande possibile, anche se la risposta ha una relazione solo parziale con la domanda dell'utente, ABBASSARE la soglia. In questo modo potrebbero esserci più casi in cui la risposta non risponde all'effettiva query dell'utente ma offre informazioni attinenti alla domanda.

Imposta soglia

Impostare il punteggio della soglia come proprietà del corpo JSON dell'API REST. Ciò significa che è stato impostato per ogni chiamata all'API REST.

Migliorare i punteggi di attendibilità

Per ottimizzare il punteggio di attendibilità di una particolare risposta a una query dell'utente, è possibile aggiungere la query al progetto come domanda alternativa per tale risposta. È anche possibile usare sinonimi senza distinzione tra maiuscole e minuscole per aggiungere i sinonimi alle parole chiave nel progetto.

Punteggi di attendibilità simili

Quando più risposte hanno un punteggio di attendibilità simile, è probabile che la query fosse troppo generica e quindi associata con pari probabilità a più risposte. Provare a strutturare meglio le domande e le risposte in modo che ogni entità di domanda/risposta abbia una finalità distinta.

Differenze di punteggio di attendibilità tra test e produzione

Il punteggio di attendibilità di una risposta può variare in modo trascurabile tra la versione di test e la versione distribuita del progetto, anche se il contenuto è lo stesso. Ciò accade perché il contenuto della versione di test e della versione distribuita del progetto si trovano in indici diversi di Azure AI Search.

L'indice di test contiene tutte le coppie di domande e risposte del progetto. Quando si esegue una query sull'indice di test, la query si applica all'intero indice, quindi i risultati vengono limitati alla partizione per tale progetto specifico. Se i risultati della query di test influiscono negativamente sulla possibilità di convalidare il progetto, è possibile:

Organizzare il progetto usando una delle opzioni seguenti:
- Una risorsa limitata a un progetto: limitare la risorsa linguistica singola (e l'indice di test di Azure AI Search risultante) a un progetto.
- Due risorse, una per il test, una per l'ambiente di produzione: hanno due risorse linguistiche, una per i test (con i propri indici di test e produzione) e una per la produzione (con i propri indici di test e produzione)
Usare sempre gli stessi parametri durante l'esecuzione di query sui progetti di test e di produzione.

Quando si distribuisce un progetto, il contenuto della domanda e della risposta del progetto passa dall'indice di test a un indice di produzione in Ricerca di Azure.

Se si dispone di un progetto in aree diverse, ogni area usa il proprio indice di Azure AI Search. Poiché vengono usati indici diversi, i punteggi non saranno esattamente gli stessi.

Nessuna corrispondenza trovata

Se lo strumento di classificazione non trova corrispondenze soddisfacenti, viene restituito il punteggio di attendibilità di 0.0 oppure "Nessuno"e la risposta predefinita restituita. È possibile modificare la risposta predefinita.

Condividi tramite