Condividi tramite


Concetti relativi all'agente dei dati di Fabric (anteprima)

L'agente dati in Microsoft Fabric è una nuova funzionalità di Microsoft Fabric che consente di creare sistemi Q&A conversazionali personalizzati usando l'intelligenza artificiale generativa. Un agente dei dati di Fabric rende le informazioni dettagliate sui dati più interattive e accessibili per tutti gli utenti dell'organizzazione. Con un agente dei dati di Fabric, il team può svolgere conversazioni, con semplici domande in lingua inglese, sui dati archiviati nell'organizzazione in Fabric OneLake e ricevere risposte pertinenti. In questo modo, anche le persone che non hanno competenze tecniche nel settore dell'intelligenza artificiale o una profonda comprensione della struttura dei dati possono ricevere risposte precise e ricche di contesto.

È anche possibile aggiungere istruzioni, esempi e materiale sussidiario specifici dell'organizzazione per ottimizzare l'agente dei dati di Fabric. Questo approccio garantisce che le risposte siano allineate alle esigenze e agli obiettivi dell'organizzazione, consentendo a tutti di interagire con i dati in modo più efficace. L'agente dei dati di Fabric promuove la cultura del processo decisionale basato sui dati, in quando riduce le barriere all'accessibilità delle informazioni dettagliate, facilita la collaborazione e consente all'organizzazione di estrarre più valore dai dati.

Importante

Questa funzionalità si trova in Anteprima.

Prerequisiti

Funzionamento dell'agente dei dati di Fabric

L'agente dati di Fabric usa modelli di linguaggio di grandi dimensioni per consentire agli utenti di interagire con i dati in modo naturale. L'agente dati di Fabric applica le API di Assistente OpenAI di Azure e si comporta come un agente. Elabora le domande utente, determina l'origine dati più pertinente (Lakehouse, Warehouse, set di dati di Power BI, database KQL, ontologia) e richiama lo strumento appropriato per generare, convalidare ed eseguire query. Gli utenti possono quindi porre domande in linguaggio normale e ricevere risposte strutturate e leggibili. Questo elimina la necessità di scrivere query complesse e assicura un accesso ai dati accurato e sicuro.

Ecco come funziona in dettaglio:

Analisi e convalida delle domande: l'agente dati di Fabric applica le API Di Azure OpenAI Assistant come agente sottostante per elaborare le domande dell'utente. Questo approccio garantisce che la domanda sia conforme ai protocolli di sicurezza, ai criteri per l'intelligenza artificiale responsabile (RAI) e alle autorizzazioni utente. L'agente dei dati di Fabric applica rigorosamente l'accesso di sola lettura, mantenendo le connessioni in sola lettura a tutte le origini dati.

Identificazione origine dati: l'agente dati di Fabric usa le credenziali dell'utente per accedere allo schema dell'origine dati. Questo approccio garantisce che il sistema recupera le informazioni sulla struttura dei dati che l'utente dispone dell'autorizzazione per la visualizzazione. Valuta quindi la domanda dell'utente rispetto a tutte le origini dati disponibili, inclusi database relazionali (Lakehouse e Warehouse), set di dati di Power BI (modelli semantici), database KQL e onlogi. Può anche fare riferimento alle istruzioni dell'agente dei dati fornite dall'utente per determinare l'origine dati più pertinente.

Invocazione dello strumento e generazione di query: Una volta identificate le origini dati corrette, l’agente dati di Fabric riformula la domanda per chiarezza e struttura e quindi invoca lo strumento corrispondente per generare una query strutturata.

  • Dal linguaggio naturale a SQL (NL2SQL) per i database relazionali (lakehouse/warehouse).
  • Dal linguaggio naturale a DAX (NL2DAX) per i set di dati di Power BI (modelli semantici).
  • Dal linguaggio naturale a KQL (NL2KQL) per i database KQL.

Lo strumento selezionato genera una query basata sullo schema, i metadati e il contesto forniti, che vengono poi passati dall'agente dei dati di Fabric sottostante.

Convalida delle query: lo strumento esegue la convalida per garantire che la query sia formata correttamente e rispetti i propri protocolli di sicurezza e criteri RAI.

Esecuzione di query e risposta: dopo la convalida, l'agente dati di Fabric esegue la query sull'origine dati scelta. I risultati vengono formattati in una risposta leggibile, che può includere dati strutturati come tabelle, riepiloghi o informazioni dettagliate chiave.

Questo approccio garantisce che gli utenti possano interagire con i propri dati in linguaggio naturale, mentre l'agente dei dati di Fabric gestisce le complessità della generazione, della convalida e dell'esecuzione di query, tutto senza bisogno che gli utenti scrivano in linguaggio SQL, DAX o KQL.

Configurazione dell'agente dei dati di Fabric

La configurazione di un agente dei dati di Fabric è simile alla creazione di un report di Power BI. Si inizia progettandolo e poi si perfeziona per assicurarsi che soddisfi le proprie esigenze, quindi si pubblica e si condivide con i colleghi in modo che possano interagire con i dati. La configurazione di un agente dei dati di Fabric prevede:

Selezione di origini dati: un agente dati di Fabric supporta fino a cinque origini dati in qualsiasi combinazione, tra cui lakehouse, warehouse, database KQL, modelli semantici di Power BI e onlogi. Ad esempio, un agente dei dati di Fabric configurato può includere cinque modelli semantici di Power BI. Può includere una combinazione di due modelli semantici di Power BI, un lakehouse e un database KQL. Sono disponibili molte opzioni.

Scelta delle tabelle pertinenti: dopo aver selezionato le origini dati, aggiungerle una alla volta e definire le tabelle specifiche di ogni origine usata dall'agente dati di Fabric. Questo passaggio garantisce che l'agente dei dati di Fabric recuperi risultati accurati concentrandosi solo sui dati pertinenti.

Aggiunta di contesto: Fornire maggiore contesto tramite le istruzioni dell'agente dati di Fabric e le query di esempio per migliorare l'accuratezza dell'agente dati di Fabric. Come l'agente sottostante per l'agente dei dati di Fabric, il contesto consente all'API assistente di Azure OpenAI di prendere decisioni più informate su come elaborare le domande dell'utente e determinare quale origine dati è più adatta per rispondere.

  • Istruzioni dell'agente dati: aggiungere istruzioni per guidare l'agente che supporta l'agente dati di Fabric, nel determinare la migliore origine dati per rispondere a specifici tipi di domande. È anche possibile fornire regole o definizioni personalizzate che chiariscano la terminologia dell'organizzazione o requisiti specifici. Queste istruzioni possono fornire più contesto o preferenze che influiscono sul modo in cui l'agente seleziona le origini dati ed esegue le query.

    • Domande dirette sulle metriche finanziarie a un modello semantico di Power BI.
    • Assegnare le query che coinvolgono l'esplorazione di dati non elaborati al lakehouse.
    • Indirizzare le domande che richiedono l'analisi dei log al database KQL.
  • Query di esempio: aggiungere coppie di query di esempio per illustrare in che modo l'agente dati di Fabric deve rispondere alle query comuni. Questi esempi fungono da guida per l'agente, aiutandolo a comprendere come interpretare domande simili e generare risposte accurate.

Nota

L'aggiunta di coppie di query/domande di esempio non è attualmente supportata per le origini dati del modello semantico di Power BI.

Combinando istruzioni di intelligenza artificiale chiare e query di esempio pertinenti, è possibile allineare meglio l'agente dati di Fabric alle esigenze dei dati dell'organizzazione, garantendo risposte più accurate e consapevoli del contesto.

Differenza tra un agente dei dati e un Copilot di Fabric

Anche se gli agenti dati di Fabric e i copiloti dell'infrastruttura usano l'intelligenza artificiale generativa per elaborare e ragionare sui dati, esistono differenze principali nelle funzionalità e nei casi d'uso:

Flessibilità di configurazione: è possibile configurare in modo elevato gli agenti dati di Fabric. È possibile fornire istruzioni ed esempi personalizzati per adattarne il comportamento a scenari specifici. I copiloti di infrastruttura, d'altra parte, sono preconfigurati e non offrono questo livello di personalizzazione.

Ambito e caso d'uso: i copiloti di Fabric supportano le attività all'interno di Microsoft Fabric, come la generazione di codice notebook o query di magazzino. Gli agenti dei dati di Fabric, al contrario, sono artefatti autonomi. Per rendere gli agenti dei dati di Fabric più versatili per casi d'uso più ampi, possono integrarsi con sistemi esterni come Microsoft Copilot Studio, Fonderia Azure AI, Microsoft Teams o altri strumenti esterni a Fabric.

Valutazione dell'agente dei dati di Fabric

Il team del prodotto ha valutato rigorosamente la qualità e la sicurezza delle risposte dell'agente dati di Fabric:

Test di benchmark: il team di prodotto ha testato gli agenti dei dati di Fabric su un'ampia gamma di set di dati pubblici e privati per garantire risposte accurate e di qualità elevata.

Mitigazioni avanzate dei danni: il team di prodotto ha implementato misure di sicurezza per garantire che gli output dell'agente dati di Fabric rimangano incentrati sul contesto delle origini dati selezionate, riducendo il rischio di risposte irrilevanti o fuorvianti.

Limitazioni

L'agente dati di Fabric è attualmente in anteprima pubblica e presenta limitazioni. Gli aggiornamenti miglioreranno l'agente dei dati di Fabric nel tempo.

  • L'agente dati di Fabric genera solo query SQL, DAX e KQL "read". Non genera query SQL, DAX o KQL che creano, aggiornano o eliminano dati.
  • L'agente dati di Fabric non supporta i dati non strutturati, ad esempio .pdf, .docxo .txt file. Non è possibile usare l'agente dei dati di Fabric per accedere a risorse di dati non strutturate.
  • L'agente dati di Fabric attualmente non supporta le lingue non in lingua inglese. Per ottenere prestazioni ottimali, fornire domande, istruzioni e query di esempio in inglese.
  • Non è possibile modificare l'LLM usato dall'agente dei dati di Fabric.
  • La cronologia delle conversazioni nell'agente dati di Fabric potrebbe non essere sempre persistente. In alcuni casi, ad esempio modifiche all'infrastruttura back-end, aggiornamenti del servizio o aggiornamenti del modello, la cronologia delle conversazioni precedenti potrebbe essere reimpostata o persa.