Configurare le origini dati per le knowledge base

Completato

La knowledge base è valida solo per i dati contenuti. Foundry IQ consente di connettersi a più origini dati, consentendo all'agente di intelligenza artificiale di accedere alle informazioni necessarie per rispondere accuratamente alle domande. Queste origini vengono configurate quando si configura la knowledge base, assicurandosi che l'agente disponga del contesto appropriato per il caso d'uso specifico.

La comprensione dell'origine dati da usare dipende dalla posizione dei dati e dal modo in cui è necessario accedervi. Foundry IQ supporta sei tipi di origine dati primari:

Sorgente dati Tipo accesso Ideale per
Indice di Ricerca intelligenza artificiale di Azure Indicizzato Ricerca aziendale con pipeline personalizzate
Blob Storage di Azure Connessione diretta File di documento in Archiviazione di Azure
Rete Internet Real-time Informazioni correnti e pubbliche tramite Bing
SharePoint (remoto) Real-time Contenuti attivi di SharePoint con la governance di Microsoft 365.
SharePoint (indicizzato) Indicizzato Ricerca avanzata in SharePoint con pipeline personalizzate
OneLake Connessione diretta Dati non strutturati in Microsoft Fabric

Con le fonti in tempo reale si ottengono informazioni aggiornate. Con le origini dati interne, ad esempio SharePoint o OneLake, si mantengono la sicurezza e la governance concedendo all'agente l'accesso alle conoscenze proprietarie.

Indice di Ricerca intelligenza artificiale di Azure

Indice di Ricerca intelligenza artificiale di Azure offre funzionalità di ricerca su scala aziendale per la knowledge base di IQ Foundry. Questa opzione è ideale quando si è già investito in Ricerca di intelligenza artificiale di Azure e si vuole usare gli indici di ricerca esistenti.

Con questa origine ci si connette direttamente all'indice di Ricerca intelligenza artificiale di Azure, che può contenere dati da più origini già elaborate e indicizzate. Questo aspetto diventa particolarmente importante quando sono necessarie funzionalità di ricerca sofisticate, ad esempio classificazione semantica, filtri o profili di punteggio personalizzati forniti da Ricerca di intelligenza artificiale di Azure.

Suggerimento

Altre informazioni su Ricerca intelligenza artificiale di Azure e su come creare e gestire gli indici di ricerca per le knowledge base.

L'agente può eseguire query su questo indice per recuperare informazioni pertinenti in base alle domande dell'utente. I vantaggi principali includono:

  • Classificazione semantica - Trova risultati contestualmente rilevanti, non solo corrispondenze di parole chiave
  • Assegnazione dei punteggi personalizzata : assegna priorità ai risultati in base alla logica di business
  • Navigazione a faccette - Filtra i risultati in base a categorie o attributi
  • Supporto multilingue - Gestisce il contenuto in lingue diverse

Blob Storage di Azure

Archiviazione BLOB di Azure consente di recuperare documenti e file direttamente dai contenitori BLOB. È possibile selezionare contenitori o BLOB specifici e Foundry IQ elabora il contenuto per renderlo disponibile per l'agente.

Questa origine funziona bene quando si archiviano documenti nell'Archiviazione Blob di Azure. I tipi di file comuni includono:

  • Documenti PDF
  • File di Microsoft Word (.docx)
  • File di testo (.txt)
  • File Markdown (.md)
  • File HTML

Annotazioni

A differenza di Ricerca di intelligenza artificiale di Azure, che richiede di compilare e gestire un indice, Archiviazione BLOB offre un percorso più diretto dai file alla knowledge base.

Basandosi su questo concetto, è possibile organizzare i BLOB in contenitori in base a argomenti o livelli di accesso, semplificando la gestione delle informazioni a cui l'agente può accedere. Questa organizzazione consente di mantenere aggiornata la governance dei dati mantenendo al tempo stesso la knowledge base.

Rete Internet

L'accesso al Web fornisce al tuo agente contenuti in tempo reale da Internet attraverso Bing. Invece di basarsi solo su dati statici e interni, l'agente può cercare le informazioni correnti durante la risposta alle domande.

Ciò diventa particolarmente importante quando gli utenti chiedono:

  • Eventi o notizie recenti
  • Prezzi o disponibilità correnti
  • Informazioni che cambiano di frequente
  • Argomenti esterni alla knowledge base interna

Importante

Con il web grounding, ci si basa sui risultati della ricerca di Bing, il che significa meno controllo sulle origini specifiche a cui fa riferimento l'agente. Quando la verifica dell'accuratezza e dell'origine è fondamentale, prendere in considerazione l'uso di origini dati indicizzate e controllate.

Suggerimento

È possibile combinare il web grounding con origini dati interne, usando l'accesso Web come origine supplementare quando la conoscenza interna non fornisce una risposta.

Opzioni di Microsoft SharePoint

L'IQ di Foundry offre due modi per connettersi a SharePoint, ognuno con vantaggi distinti. La tabella seguente confronta questi approcci:

Caratteristica / Funzionalità Remote Indicizzato
Metodo di accesso Query in tempo reale Indice pre-elaborato
Tempo di risposta Dipende da SharePoint Più velocemente
Manutenzione Nessun indice da gestire Richiede aggiornamenti dell'indice
Ricerca avanzata Limitato Funzionalità complete di Ricerca intelligenza artificiale di Azure
Aggiornamento dei dati Sempre aggiornato Dipende dalla pianificazione dell'indicizzazione
Gestione delle autorizzazioni Rispetta le autorizzazioni di SharePoint Configurato durante l'indicizzazione

SharePoint Remoto

SharePoint Remote offre funzionalità di ricerca con la governance di Microsoft 365, recuperando il contenuto direttamente da SharePoint senza preindicizzare. L'agente cerca siti e raccolte di SharePoint in tempo reale quando gli utenti pongono domande.

Vantaggi principali dell'accesso remoto:

  • Nessuna manutenzione dell'indice necessaria
  • Accede sempre al contenuto corrente di SharePoint
  • Rispetta automaticamente le autorizzazioni di SharePoint esistenti
  • Impostazione e configurazione più semplici

Suggerimento

Usare SharePoint Remote quando è necessario il percorso più semplice per i dati di SharePoint e non richiedere funzionalità di ricerca avanzate.

SharePoint Indicizzato

SharePoint Indexed adotta un approccio diverso tramite l'indicizzazione del contenuto di SharePoint in Ricerca di intelligenza artificiale di Azure per le pipeline personalizzate. A differenza dell'accesso remoto, che esegue query su SharePoint in tempo reale, l'indicizzazione elabora in anticipo il contenuto di SharePoint.

Questa pre-elaborazione implica tempi di risposta più rapidi e funzionalità di ricerca più sofisticate. Con il contenuto indicizzato, è possibile:

  1. Applicare analizzatori personalizzati per la terminologia specializzata
  2. Creare pipeline di arricchimento con i servizi di intelligenza artificiale
  3. Combinare i dati di SharePoint con altre origini
  4. Creare esperienze di ricerca specializzate

Annotazioni

SharePoint indicizzato funziona al meglio quando sono necessarie funzionalità di ricerca avanzate o quando si integrano i dati di SharePoint con altre origini nell'indice di Ricerca di intelligenza artificiale di Azure.

Microsoft OneLake

Microsoft OneLake consente di accedere ai dati non strutturati archiviati nella data lakehouse di Microsoft Fabric. Ci si connette a OneLake per recuperare i file e i documenti archiviati nel lakehouse, rendendo questi dati disponibili per la knowledge base.

Suggerimento

Altre informazioni su Microsoft Fabric OneLake e su come funge da data lake unificato per l'organizzazione.

Questa opzione è importante quando l'organizzazione usa Microsoft Fabric per l'analisi e l'archiviazione dei dati. I casi d'uso comuni includono:

  • Report di Business Intelligence - Fare riferimento ai risultati analitici nelle risposte degli agenti
  • Documentazione sui dati - Fornire contesto sui set di dati e sulle metriche
  • Risultati analitici - Condividere informazioni dettagliate dal lavoro di data science
  • Output della ricerca - Rendere accessibile la ricerca tramite l'intelligenza artificiale conversazionale

Con questa connessione, l'agente può fare riferimento a queste informazioni quando si rispondono a domande aziendali, fornendo risposte basate sui dati basate sul lavoro analitico dell'organizzazione.

Scegliere l'origine dati corretta

La selezione dell'origine dati appropriata dipende da diversi fattori. Usare questa guida decisionale:

Se i dati sono... E hai bisogno di... Scegliere...
In SharePoint Configurazione semplice, sempre aggiornata SharePoint Remoto
In SharePoint Ricerca avanzata, pipeline personalizzate SharePoint Indicizzato
File in Azure Accesso diretto ai file Blob Storage di Azure
In Microsoft Fabric Contenuto del Data Lakehouse OneLake
Già indicizzato Investimento esistente in Azure AI Search Indice di Ricerca intelligenza artificiale di Azure
Informazioni pubbliche e aggiornate Contenuto Web in tempo reale Rete Internet

Importante

È possibile combinare più origini in una singola knowledge base. Ad esempio, usare i dati di SharePoint interni come knowledge base principale, abilitando al tempo stesso il web grounding per gli eventi correnti o le informazioni supplementari.