Che cos'è la classificazione semantica?

Completato

La classificazione semantica è una funzionalità all'interno di Azure AI Search che mira a migliorare la classificazione dei risultati della ricerca. La classificazione semantica migliora la classificazione dei risultati della ricerca usando la comprensione del linguaggio per trovare una corrispondenza più accurata del contesto della query originale.

Funzione di rango BM25

Azure AI Search usa la funzione di rango BM25 per impostazione predefinita. La funzione di rango BM25 classifica i risultati della ricerca in base alla frequenza in cui il termine di ricerca viene visualizzato all'interno di un documento. La funzione di rango BM25 consente spesso di ottenere risultati di rango eccellenti, perché un documento che include spesso un termine di ricerca è spesso il più rilevante, ma questo non è sempre il caso. La classificazione BM25 non inserisce alcuna pertinenza nella semantica della query e della classificazione può talvolta essere migliorata aggiungendo la comprensione del linguaggio.

Classificazione semantica

La classificazione semantica ha due funzioni: migliora la classificazione dei risultati della query in base alla comprensione del linguaggio e ottimizza la risposta alla query fornendo didascalia e risposte nei risultati.

La classificazione semantica usa la classificazione BM25 e calcola un nuovo punteggio di pertinenza usando la classificazione BM25 originale combinata con i modelli di comprensione del linguaggio per estrarre il contesto e il significato della query.

Didascalie e risposte semantiche

Le didascalia e le risposte semantiche forniscono risultati aggiuntivi insieme ai risultati della ricerca classificati che è possibile visualizzare per migliorare la comprensione dei risultati per gli utenti.

Le didascalie semantiche selezionano frasi riassuntive dal testo integrale del documento ed evidenziano il testo più pertinente nelle frasi di riepilogo.

Le risposte semantiche sono una funzionalità aggiuntiva facoltativa della classificazione semantica che fornisce risposte alle domande. Se la query di ricerca sembra essere una domanda e i risultati della ricerca contengono testo che sembra essere una risposta pertinente, viene restituita la risposta semantica.

Funzionamento della classificazione semantica

La classificazione semantica prende i primi 50 risultati dai risultati della classificazione BM25. I risultati vengono suddivisi in più campi, come definito da una configurazione semantica. I campi vengono convertiti in stringhe di testo e tagliati in 256 token univoci. Un token equivale approssimativamente a una parola nel documento.

Dopo aver preparato le stringhe, vengono passate ai modelli di comprensione di lettura automatica per trovare le frasi che meglio corrispondono alla query. I risultati di questa frase di riepilogo sono un didascalia semantica e, facoltativamente, una risposta semantica.

Le didascalie semantiche vengono ora classificate in base alla pertinenza semantica della didascalia. I risultati vengono quindi restituiti in ordine decrescente di pertinenza.

Funzionalità di classificazione semantica

Per una panoramica delle funzionalità di AI Search, vedere il video seguente:

Vantaggi della classificazione semantica

La classificazione semantica presenta due vantaggi principali rispetto ai risultati di ricerca tradizionali:

  • La classificazione semantica può classificare i risultati in modo più simile alla semantica della query originale. In questo modo è più probabile che i documenti più utili vengano visualizzati nella parte superiore dei risultati della ricerca.
  • La classificazione semantica può trovare stringhe all'interno dei risultati per il rendering come didascalia nella pagina dei risultati della ricerca e fornire una risposta a una domanda.

Limitazioni della classificazione semantica

La classificazione semantica viene applicata ai risultati restituiti dalla funzione di rango BM25. Anche se la classificazione semantica può rivalutare i risultati forniti dalla funzione di rango BM25, non fornirà documenti aggiuntivi non restituiti dalla funzione di rango BM25.

La classificazione semantica usa i primi 50 risultati della funzione di rango BM25. Se vengono restituiti più di 50 risultati, vengono considerati solo i primi 50 risultati.

Prezzi della classificazione semantica

Fino a 1000 query di classificazione semantica al mese sono disponibili gratuitamente.

Per più di 1000 query al mese, è consigliabile scegliere i prezzi standard. Il costo dei prezzi standard si basa sul volume di ricerche, sul tipo di ricerche e sull'area della ricerca.

Per altre informazioni sui prezzi della classificazione semantica, vedere Prezzi di Azure AI Search