Condividi tramite


Funzionalità di Azure AI Search

Azure AI Search fornisce il recupero delle informazioni e usa l'integrazione facoltativa dell'intelligenza artificiale per estrarre più valore dal testo e dal contenuto del vettore.

La tabella seguente riepiloga le funzionalità per categoria. Per altre informazioni su come Azure AI Search si pone rispetto ad altre tecnologie di ricerca, vedere Confronta opzioni di ricerca.

Esistono parità di funzionalità in tutti i cloud pubblici, privati e sovrani di Azure, ma alcune funzionalità non sono supportate in aree specifiche. Per altre informazioni, vedere Scegliere un'area.

Nota

Si stanno cercando le funzionalità di anteprima? Vedere l'elenco delle funzionalità di anteprima.

Funzionalità di indicizzazione

Categoria Funzionalità
Origini dati Gli indici di ricerca possono accettare testo da qualsiasi origine, purché venga inviato come documento JSON.

Gli indicizzatori sono una funzionalità che automatizza l'importazione dei dati da origini dati supportate per estrarre contenuto ricercabile negli archivi dati primari. Gli indicizzatori gestiscono automaticamente la serializzazione JSON e supportano la maggior parte delle forme di rilevamento delle modifiche e dell'eliminazione. È possibile connettersi a un'ampia gamma di origini dati, tra cui OneLake, Database SQL di Azure, Azure Cosmos DB o Archiviazione BLOB di Azure.
Strutture di dati gerarchici e annidati I tipi complessi e le raccolte consentono di modellare di fatto qualsiasi tipo di struttura JSON in un indice di ricerca. Le cardinalità uno-a-molti e molti-a-molti possono essere espresse in modo nativo tramite raccolte, tipi complessi e raccolte di tipi complessi.
Analisi linguistica Gli analizzatori sono componenti usati per l'elaborazione del testo durante le operazioni di indicizzazione e di ricerca. Per impostazione predefinita, è possibile usare l'analizzatore Lucene Standard per utilizzo generico oppure eseguire l'override dell'impostazione predefinita con un analizzatore del linguaggio, un analizzatore personalizzato configurato o un altro analizzatore predefinito che produce token nel formato necessario.

Gli analizzatori di linguaggio di Lucene o Microsoft sono usati per gestire in modo intelligente le funzionalità linguistiche specifiche di una lingua tra cui i tempi verbali, il genere, i sostantivi plurali irregolari, ad esempio "uomo" e "uomini", la scomposizione delle parole, il ritorno a capo, per le lingue senza spazi, e altro.

Gli analizzatori lessicali personalizzati vengono usati per moduli di query complessi, ad esempio la corrispondenza fonetica e le espressioni regolari.

Categoria Funzionalità
Indicizzazione vettoriale All'interno di un indice di ricerca aggiungere campi vettoriali per supportare scenari di ricerca vettoriale. I campi vettoriali possono coesistere con campi non di filtro nello stesso documento di ricerca.
Query vettoriali Formulare query con vettore singolo e multiplo.
Algoritmi di ricerca vettoriale Usare HNSW (Hierarchical Navigable Small World) o K-Nearest Neighbors (KNN) completo per trovare vettori simili in un indice di ricerca.
Filtri vettoriali Applicare filtri prima o dopo l'esecuzione della query per una maggiore precisione durante il recupero delle informazioni.
Recupero di informazioni ibride Cercare concetti e parole chiave in una singola richiesta di query ibrida.

Ricerca ibrida consolida la ricerca di vettori e testo con la classificazione semantica facoltativa e l'ottimizzazione della pertinenza per ottenere risultati ottimali.
Suddivisione in blocchi e vettorizzazione dei dati integrati Suddivisione in blocchi di dati nativi tramite la competenza Suddivisione testo. Vettorizzazione nativa tramite vettorizzatori e competenze di incorporamento, ad esempio AzureOpenAIEmbeddingModel, Visione di Azure AI multimodale e la competenza AML che è possibile usare per connettersi agli endpoint nel catalogo dei modelli di Azure AI Studio.

La vettorizzazione integrata fornisce una pipeline di indicizzazione end-to-end dai file di origine alle query.
Compressione e quantizzazione dei vettori integrati Usare la quantizzazione scalare e binaria predefinita per ridurre le dimensioni dell'indice vettoriale in memoria e su disco. È anche possibile rinunciare all'archiviazione dei vettori non necessari o assegnare tipi di dati limitati ai campi vettoriali per ridurre i requisiti di archiviazione.

Intelligenza artificiale applicata e knowledge mining

Categoria Funzionalità
Elaborazione di intelligenza artificiale durante l'indicizzazione L'arricchimento tramite intelligenza artificiale si riferisce all'elaborazione incorporata di immagini e linguaggi naturali in una pipeline dell'indicizzatore che estrae testo e informazioni dal contenuto che altrimenti non potrebbero essere indicizzati per la ricerca full-text. L'elaborazione dell'intelligenza artificiale viene ottenuta aggiungendo e combinando competenze in un set, che viene quindi collegato a un indicizzatore. L'intelligenza artificiale può essere rappresentata da competenze predefinite di Microsoft, ad esempio la traduzione testuale o il riconoscimento ottico dei caratteri (OCR) o da competenze personalizzate fornite dall'utente.
Archiviazione di contenuto arricchito per l'analisi e l'utilizzo in scenari non di ricerca L'archivio conoscenze è un archivio permanente di contenuto arricchito, destinato a scenari non di ricerca come il knowledge mining e l'elaborazione di data science. Un archivio conoscenze viene definito in un set di competenze, ma creato in Archiviazione di Azure come oggetti o set di righe tabulari.
Arricchimenti memorizzati nella cache La memorizzazione nella cache degli arricchimenti (anteprima) fa riferimento agli arricchimenti memorizzati nella cache che possono essere riutilizzati durante l'esecuzione del set di competenze. La memorizzazione nella cache è particolarmente utile nei set di competenze che includono OCR e analisi delle immagini, che sono costosi da elaborare.

Full-text e altri moduli di query

Categoria Funzionalità
Ricerca di testo in formato libero Ricerca full-text è un caso d'uso principale per la maggior parte delle app basate sulla ricerca. È possibile formulare query servendosi di una sintassi supportata.

La sintassi di query semplice offre operatori logici, operatori di ricerca di una frase, operatori di suffisso, operatori di precedenza.

La sintassi di query Lucene completa include tutte le operazioni della sintassi semplice, con estensioni per ricerche fuzzy, ricerche per prossimità, aumento della priorità dei termini ed espressioni regolari.
Pertinenza La semplicità di assegnazione dei punteggi è un vantaggio chiave di Azure AI Search. I profili di punteggio vengono usati per modellare la rilevanza in funzione dei valori nei documenti stessi. Ad esempio, si potrebbe decidere che prodotti più recenti o prodotti scontati compaiano prima tra i risultati della ricerca. È inoltre possibile compilare profili di puntaggio utilizzando tag per il punteggio personalizzati in base alle preferenze di ricerca cliente che sono stati rilevati e archiviati separatamente.

Il Classificatore semantico è una funzionalità premium che classifica i risultati in base alla pertinenza semantica per la query. A seconda del contenuto e dello scenario, può migliorare significativamente la pertinenza della ricerca con una configurazione o un impegno quasi minimo.
Ricerca geospaziale Le funzioni geospaziali filtrano e trovano una corrispondenza in base alle coordinate geografiche. È possibile effettuare una corrispondenza sulla distanza o tramite l'inclusione in una forma poligono.
Filtri e facet L'Esplorazione in base a facet viene abilitata tramite un singolo parametro di query. Azure AI Search restituisce una struttura di esplorazione in base a facet che è possibile usare come codice alla base di un elenco di categorie per i filtri autoindirizzati, ad esempio per filtrare gli elementi di un catalogo in base all'intervallo di prezzi o al marchio.

È possibile usare i filtri per incorporare l'esplorazione in base a facet nell'interfaccia utente dell'applicazione, migliorare la formulazione di query e filtrare in base a criteri specificati dall'utente o dallo sviluppatore. Creare filtri mediante la sintassi OData.
Esperienza utente Completamento automatico può essere abilitato per le query con completamento automatico in una barra di ricerca.

Suggerimenti per la ricerca funziona anche all'esterno di input di testo parziale in una barra di ricerca, ma i risultati sono documenti effettivi nell'indice anziché nei termini della query.

Sinonimi associa termini equivalenti, che espandono in modo implicito l'ambito di una query, senza che l'utente debba fornire il termine alternativo.

L'evidenziazione dei risultati applica la formattazione del testo a una parola chiave corrispondente nei risultati della ricerca. È possibile scegliere i campi che devono restituire i frammenti evidenziati.

ordinamento è disponibile per più campi tramite lo schema dell'indice e viene attivato o disattivato in fase di query con un solo parametro di ricerca.

Il paging e la limitazione dei risultati della ricerca non comportano alcuna difficoltà grazie al controllo accurato che Ricerca di Azure offre sui risultati della ricerca.

Funzionalità di sicurezza

Categoria Funzionalità
Crittografia dei dati La crittografia dei dati inattivi gestita da Microsoft è incorporata nel livello di archiviazione interno ed è irrevocabile.

Chiavi di crittografia gestite dal cliente create e gestite in Azure Key Vault, possono essere usate per la crittografia supplementare di indici e mappe sinonimi. Per i servizi creati dopo il 1° agosto 2020, la crittografia delle chiavi gestite dal cliente si estende ai dati nei dischi temporanei, per la doppia crittografia completa del contenuto indicizzato.
Endpoint Protection Regole IP per il supporto del firewall in ingresso consente di configurare intervalli IP per cui il servizio di ricerca accetterà le richieste.

Creare un endpoint privato usando collegamento privato di Azure per forzare tutte le richieste tramite una rete virtuale.
Accesso in ingresso Il Controllo degli accessi in base al ruolo assegna ruoli a utenti e gruppi in Microsoft Entra ID per l'accesso controllato ai contenuti e alle operazioni di ricerca. È anche possibile usare l'autenticazione basata su chiave se non si vogliono usare le assegnazioni di ruolo.
Sicurezza in uscita (indicizzatori) L'Accesso ai dati tramite endpoint privati consente a un indicizzatore di connettersi alle risorse di Azure protette tramite collegamento privato di Azure.

Accesso ai dati tramite un'identità attendibile significa che le stringhe di connessione a origini dati esterne possono omettere nomi utente e password. Quando un indicizzatore si connette all'origine dati, la risorsa consente la connessione se il servizio di ricerca è stato registrato in precedenza come servizio attendibile.

Funzionalità del portale

Categoria Funzionalità
Strumenti per la creazione di prototipi e l'ispezione Aggiungi indice è una finestra di progettazione degli indici nel portale che è possibile usare per creare uno schema di base costituito da campi con attributi e altre impostazioni. Dopo aver salvato l'indice, è possibile popolarlo usando un SDK o l'API REST per fornire i dati.

Importazione guidata dati crea indici, indicizzatori, set di competenze e definizioni di origine dati. Se i dati sono presenti in Azure, questa procedura guidata consente di risparmiare tempo e impegno significativi, soprattutto per l'analisi e l'esplorazione del modello di verifica.

Importa e vettorizza dati crea una pipeline di indicizzazione completa che include la suddivisione in blocchi di dati e la vettorizzazione. La procedura guidata crea tutti gli oggetti e le impostazioni di configurazione.

Esplora ricerche viene usato per testare le query e perfezionare i profili di punteggio.

Creare un'app demo viene usata per generare una pagina HTML che può essere usata per testare l'esperienza di ricerca.

Sessioni di debug è un editor visivo che consente di eseguire il debug di un set di competenze in modo interattivo. Mostra le dipendenze, l'output e le trasformazioni.
Monitoraggio e diagnostica Abilitare le funzionalità di monitoraggio per andare oltre le metriche sempre visibili a colpo d'occhio nel portale. Le metriche sulle query al secondo, sulla latenza e sulla limitazione vengono acquisite e inserite in report nelle pagine del portale, senza necessità di configurazioni aggiuntive.

Programmabilità

Categoria Funzionalità
REST API REST del servizio è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

L'API REST di gestione si applica alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per .NET Azure.Search.Documents è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

Microsoft.Azure.Management.Search si applica alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Java com.azure.search.documents è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

com.microsoft.azure.management.search si applica alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Python azure-search-documents è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

azure-mgmt-search si applica alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per JavaScript/TypeScript azure/search-documents è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche.

azure/arm-search si applica alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.

Vedi anche