Condividi tramite


Vedi la sezione Curare uno spazio Genie efficace

L’obiettivo di curare uno spazio Genie è creare un ambiente in cui gli utenti aziendali possono porre domande in linguaggio naturale e ricevere risposte accurate e coerenti in base ai dati. Gli spazi genie utilizzano modelli avanzati che generano query sofisticate e comprendono le conoscenze generali del mondo.

La maggior parte delle domande aziendali è specifica del dominio, quindi il ruolo di un curatore spaziale consiste nel colmare il divario tra la conoscenza generale del mondo e il linguaggio specializzato usato in un dominio specifico o da una particolare azienda. I curatori usano metadati e istruzioni per aiutare Genie a interpretare e rispondere accuratamente alle domande degli utenti aziendali. Questo articolo illustra le procedure consigliate e i principi che consentono di sviluppare uno spazio efficace.

Procedure consigliate per la definizione di un nuovo spazio

Le sezioni seguenti consigliano procedure per la creazione di uno spazio efficace.

Iniziare in piccolo

La cura di uno spazio Genie è un processo iterativo. Quando si crea un nuovo spazio, iniziare il più piccolo possibile, con istruzioni minime e un set limitato di domande a cui rispondere. È quindi possibile aggiungere durante l’iterazione in base al feedback e al monitoraggio. Questo approccio semplifica la creazione e la gestione dello spazio e consente di curarlo in modo efficace in risposta alle esigenze degli utenti reali.

Utilizzare le linee guida seguenti per creare un piccolo spazio Genie:

  • Rimani concentrato: includere solo le tabelle necessarie per rispondere alle domande che si vuole che lo spazio gestisca. Punta a cinque o meno tabelle. Maggiore è il livello di concentrazione della selezione, meglio è. Mantenere lo spazio limitato su una piccola quantità di dati è ideale, quindi limitare il numero di colonne nelle tabelle incluse.
  • Pianificare l'iterazione: iniziare con una configurazione minima per lo spazio, concentrandosi su tabelle essenziali e istruzioni di base. Aggiungere linee guida ed esempi più dettagliati durante il perfezionamento dello spazio nel tempo, invece di puntare inizialmente alla perfezione.
  • Basarsi su tabelle ben annotate: Genie utilizza i nomi delle colonne e le descrizioni del Catalogo Unity per generare risposte. La chiarezza dei nomi e delle descrizioni delle colonne consente di produrre risposte di alta qualità. Le descrizioni delle colonne devono offrire informazioni contestuali precise. Evitare dettagli ambigui o non necessari. Esaminare le descrizioni generate dall’intelligenza artificiale per ottenere precisione e chiarezza e usarle solo se sono allineate a ciò che si desidera fornire manualmente.

Chiedere a un esperto di dominio di definire lo spazio

Un creatore di spazio efficace deve comprendere i dati e le informazioni dettagliate che possono essere ottenute da esso. Gli analisti dei dati esperti di SQL hanno in genere le conoscenze e le competenze necessarie per curare lo spazio.

Definire lo scopo dello spazio

L'identificazione del pubblico e dello scopo specifici dello spazio consente di decidere quali dati, istruzioni e domande testare da usare. Uno spazio deve rispondere a domande relative a un argomento e a un pubblico specifico, non a domande generali in vari domini. È possibile semplificare i set di dati pregiudendo le tabelle e rimuovendo colonne non necessarie prima di aggiungere dati a uno spazio. Mentre aggiungi dati allo spazio, mantienili strettamente concentrati sullo scopo definito dello spazio. Nascondere le colonne che potrebbero generare confusione o non importanti. Vedi Mostra o nascondi colonne.

Aggiungere metadati e sinonimi

È possibile aggiungere sinonimi di colonna e descrizioni personalizzate ai dati in uno spazio Genie. Questi metadati hanno come ambito lo spazio Genie e non sovrascrivono i metadati archiviati nel catalogo unity. Le descrizioni delle colonne di qualità e i sinonimi consentono a Genie di comprendere meglio la colonna, sceglierla per le domande pertinenti e scrivere codice SQL più accurato. Vedere Modificare i metadati della colonna.

Abilitare il campionamento dei dati Genie

Importante

Questa funzionalità è in Anteprima Pubblica.

Un amministratore dell'area di lavoro può abilitare Il campionamento dei dati Genie per l'area di lavoro. Il campionamento dei dati migliora l'accuratezza di Genie eseguendo il campionamento dei valori dei set di dati nello spazio, consentendo una migliore corrispondenza con le richieste degli utenti alle colonne e ai valori corretti. Se abilitata, Genie campiona automaticamente i valori delle tabelle durante la creazione dello spazio. È possibile gestire le colonne con dati campionati. Vedere Gestire gli oggetti dati e Usare il campionamento dei valori per migliorare l'accuratezza di Genie.

Fornire esempi e istruzioni incentrati

Gli spazi genie si comportano al meglio con un set limitato e mirato di istruzioni. Databricks consiglia di sfruttare query SQL di esempio per fornire istruzioni nel tuo spazio di lavoro. Le query SQL di esempio consentono a Genie di abbinare le richieste degli utenti alle query SQL verificate e di apprendere da esempi per rispondere a domande correlate. Vedere Aggiungere query e funzioni SQL di esempio.

Per il contesto che deve essere applicato a livello globale nello spazio Genie, un piccolo set ben organizzato di istruzioni di testo normale può anche contribuire a mantenere la pertinenza e migliorare la qualità della risposta. Troppe istruzioni possono ridurre l'efficacia, specialmente nelle conversazioni più lunghe, perché Genie potrebbe faticare a classificare in ordine di priorità le indicazioni più importanti. Per informazioni dettagliate, vedere Fornire istruzioni.

Testare e regolare

Dovresti essere il primo utente del tuo spazio. Dopo aver creato un nuovo spazio, iniziare a porre domande. Esaminare attentamente il codice SQL generato in risposta alle domande. Se Genie interpreta erroneamente i dati, le domande o il gergo aziendale, è possibile intervenire modificando il codice SQL generato o fornendo altre istruzioni specifiche. Continuare a testare e modificare finché non si ottengono risposte affidabili.

Dopo aver esaminato una domanda, è possibile aggiungerla come domanda di riferimento che può essere usata per testare e valutare sistematicamente la precisione complessiva del tuo spazio. È possibile usare varianti e formulazioni di domande diverse per testare le risposte di Genie. Consulta Usare i benchmark nello spazio Genie.

Vedere Risoluzione dei problemi per idee sulla correzione di risposte errate.

Condurre i test dell’utente

Dopo aver verificato la qualità della risposta tramite test, reclutare un utente aziendale per provare lo spazio Genie. Utilizzare le linee guida seguenti per fornire un percorso utente semplice e raccogliere feedback per un miglioramento continuo:

  • Impostare le aspettative che il loro lavoro è quello di aiutare a perfezionare la stanza.
  • Chiedere loro di concentrare il test sull’argomento specifico e le domande che lo spazio è progettato per rispondere.
  • Se ricevono una risposta errata, invita gli utenti ad aggiungere istruzioni aggiuntive e chiarimenti nella chat per perfezionare la risposta. Quando viene fornita una risposta corretta, si dovrebbe dare un voto positivo alla query finale per ridurre al minimo errori simili nelle interazioni future.
  • Indicare agli utenti di richiamare o disattivare le risposte usando il meccanismo di feedback predefinito.
  • Invitare gli utenti a condividere commenti e suggerimenti aggiuntivi e domande non risolte direttamente con gli autori dello spazio. Gli autori e gli editor possono utilizzare il feedback per perfezionare istruzioni, esempi e asset attendibili.

Valutare la possibilità di fornire materiali di formazione o un documento scritto con linee guida per testare la sala e fornire feedback. Indirizzare gli utenti aziendali a usare uno spazio Genie per esplorare i dati aziendali per aiutarli a iniziare a lavorare con un nuovo spazio Genie.

Man mano che gli utenti aziendali testano lo spazio, gli editor di spazio possono visualizzare le domande poste nella scheda Monitoraggio . Continuare ad aggiungere il contesto per aiutare Genie a interpretare correttamente le domande e i dati per fornire risposte accurate. Vedere Monitorare lo spazio per altre informazioni sul monitoraggio degli spazi Genie. È anche possibile usare i log di controllo per monitorare il feedback dello spazio Genie e rivedere le richieste. Vedere Monitorare l'utilizzo di intelligenza artificiale/BI con log di controllo e avvisi.

Nota

Gli utenti aziendali devono essere membri dell’area di lavoro di origine per accedere allo spazio. Vedere Autorizzazioni necessarie per informazioni su come fornire le autorizzazioni appropriate per interagire con lo spazio.

Risoluzione dei problemi

Le sezioni seguenti illustrano come risolvere i problemi comuni.

Gergo professionale frainteso

La maggior parte delle aziende o dei domini ha una sintassi abbreviata specifica usata per comunicare eventi specifici dell’azienda. Ad esempio, quando si fa riferimento a un anno, potrebbe sempre significare l’anno fiscale e l’anno fiscale potrebbe iniziare a febbraio o marzo anziché a gennaio. Per consentire a Genie di rispondere a queste domande in modo naturale e accurato, includere istruzioni che eseguono il mapping esplicito del gergo aziendale a parole e concetti che Genie può comprendere. Vedi Fornire istruzioni.

Utilizzo errato della tabella o della colonna

Se Genie tenta di eseguire il pull dei dati da una tabella non corretta o di eseguire analisi su colonne non corrette, è possibile modificare i dati in uno dei modi seguenti:

  • Fornire descrizioni chiare e precise: controllare le tabelle e i metadati associati per verificare che la terminologia usata corrisponda alla terminologia degli utenti nelle domande inviate. In caso contrario, perfezionare la descrizione o aggiungere un’istruzione che esegue il mapping della terminologia usata nella tabella alla terminologia usata nella domanda.
  • Aggiungere query di esempio: fornire query SQL di esempio che Genie può utilizzare per imparare a rispondere a determinate domande. Vedi Fornire istruzioni.
  • Rimuovere tabelle o colonne dallo spazio: alcune tabelle possono includere colonne o concetti sovrapposti che rendono difficile per Genie conoscere i dati da utilizzare in una risposta. Se possibile, rimuovere tabelle o colonne non necessarie o sovrapposte. Per nascondere rapidamente le colonne dall'interfaccia utente dello spazio Genie, senza modificare gli oggetti dati sottostanti, vedere Mostrare o nascondere colonne.

Errori di filtro

Le query generate spesso includono una WHERE clausola per filtrare i risultati in base a un valore specifico. Quando Genie non ha visibilità sui valori dei dati, potrebbe impostare la WHERE clausola per filtrare il valore errato. Ad esempio, potrebbe provare a trovare la corrispondenza con il nome "California" quando la tabella usa abbreviazioni come "CA".

Per situazioni come questa, provare una delle strategie seguenti:

  • Se necessario, un amministratore dell'area di lavoro dovrebbe abilitare Genie Data Sampling dalla pagina Anteprime. In questo modo è possibile abilitare le funzionalità che consentono a Genie di trovare una corrispondenza migliore con i prompt degli utenti ai valori di colonna. Vedere Usare il campionamento dei valori per migliorare l'accuratezza di Genie.
  • Verificare che le colonne pertinenti abbiano valori di esempio e dizionari valore abilitati. Se sono stati aggiunti nuovi dati alle tabelle pertinenti, aggiornare i valori. Visualizza le colonne.

Join non corretti

Se i riferimenti di chiave esterna non sono definiti nel Unity Catalog, lo spazio potrebbe non sapere come unire tabelle diverse.

Provare almeno una fra le seguenti soluzioni:

  • Definire i riferimenti di chiave esterna nel Catalogo Unity quando possibile. Vedere la clausola CONSTRAINT.
  • Fornire esempi di query in cui si effettua un join delle tabelle in modo standard.
  • Se le relazioni di chiave esterna delle tabelle non vengono specificate nel Catalogo Unity, documentarle nelle istruzioni.

Se nessuna di queste soluzioni risolve il problema, unire anticipatamente la tabella in una vista e usarla come input per lo spazio. Questa strategia è utile per scenari di join più complessi, ad esempio self-join.

Commenti di colonna non sincronizzati da tabelle esterne

Azure Databricks non gestisce i metadati, i dati o la semantica per le scritture in tabelle esterne. A seconda della tabella di origine, i commenti potrebbero non essere accessibili da Azure Databricks. Per rendere disponibili i commenti, Azure Databricks consiglia di eseguire una delle operazioni seguenti:

  • Modificare i metadati delle colonne nell'interfaccia utente dello spazio Genie. I metadati modificati si applicano solo allo spazio Genie in cui è scritto. Vedere Modificare i metadati della colonna.
  • Creare viste materializzate sopra le tabelle federate. È possibile aggiungere e modificare commenti in una vista materializzata come si farebbe in una tabella gestita. È possibile riutilizzare questa visualizzazione in più spazi Genie. Per informazioni dettagliate sul caricamento di dati da tabelle esterne a una vista materializzata, vedere Caricare dati da tabelle esterne con viste materializzate. Per altre informazioni sull'uso di viste materializzate, vedere Viste materializzate.

Problemi di calcolo delle metriche

Il modo in cui vengono calcolate le metriche e l'aggregazione dei dati può essere arbitrariamente complicato e includere molti dettagli aziendali che la tua area non comprende. Ciò può causare una segnalazione errata.

Provare almeno una fra le seguenti soluzioni:

  • Se le metriche vengono aggregate dalle tabelle di base, fornire query SQL di esempio che calcolano ogni valore di rollup.
  • Se le metriche sono state pre-calcolate e si trovano in tabelle aggregate, spiegarne le informazioni nei commenti delle tabelle. Specificare aggregazioni valide per ogni metrica se è possibile eseguire il rollup delle metriche in tale tabella.
  • Se SQL che stai cercando di generare è molto complicato, prova a creare viste che hanno già aggregato le metriche per il tuo spazio.

Calcoli basati sul tempo non corretti

Genie potrebbe non essere sempre in grado di dedurre il fuso orario rappresentato nei dati o nel fuso orario in cui l'analisi deve essere eseguita, a meno che non si forniscano in modo esplicito indicazioni aggiuntive.

Includere istruzioni più esplicite che illustrano in dettaglio il fuso orario di origine originale, la funzione di conversione e il fuso orario di destinazione. Gli esempi seguenti illustrano come modificare le istruzioni generali per conversioni di fuso orario più affidabili:

  • Convertire sempre le ore in un fuso orario specifico: in questo esempio si supponga che il timestamp di origine sia UTC e si vogliano ottenere i risultati nel fuso orario America/Los_Angeles. Aggiungere quanto segue alle istruzioni, sostituendo <timezone-column> con il nome di colonna appropriato:
    • I fusi orari nelle tabelle si trovano in UTC.
    • Convertire tutti i fusi orari usando la funzione seguente: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Convertire i formati datetime non UTC in UTC: se il fuso orario predefinito dell'area di lavoro è UTC ma gli utenti di Los Angeles devono fare riferimento a oggi per un set specifico di record, aggiungere quanto segue alle istruzioni generali dello spazio:
    • Per fare riferimento a oggi, usare 'date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))

Vedere la funzione convert_timezone.

Ignorare le istruzioni

Anche se hai spiegato le tue tabelle e colonne nei commenti e fornito istruzioni generali, il tuo spazio potrebbe comunque non utilizzarle correttamente.

Provare almeno una fra le seguenti operazioni:

  • Fornire query di esempio che usano correttamente le tabelle. Le query di esempio sono particolarmente efficaci per insegnare al tuo sistema come sfruttare i tuoi dati.
  • Nascondere colonne irrilevanti nello spazio Genie. Vedi Mostra o nascondi colonne.
  • Crea viste dalle tue tabelle che offrono una visualizzazione più semplice dei tuoi dati.
  • Esaminare le istruzioni e provare a concentrare lo spazio rimuovendo tabelle o istruzioni irrilevanti.
  • Provare ad avviare una nuova chat. Le interazioni precedenti potrebbero influenzare le risposte di Genie in una determinata chat, ma l'avvio di una nuova chat offre un punto di partenza vuoto per testare nuove istruzioni.

Problemi di prestazioni

Quando Genie deve generare query o risposte di testo estremamente lunghe, può richiedere un tempo considerevole per rispondere o persino andare in timeout durante la fase di elaborazione.

Provare una o più delle azioni seguenti per migliorare le prestazioni:

  • Utilizzare asset o viste attendibili per incapsulare query complesse. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.
  • Ridurre la lunghezza delle query SQL di esempio quando possibile.
  • Avviare una nuova chat se Genie inizia a generare risposte lente o non riuscite.

Risposte inaffidabili alle domande cruciali

Utilizzare gli asset attendibili per fornire risposte verificate a domande specifiche che si prevede vengano poste dagli utenti. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.

Avviso relativo al limite di token

I token sono le unità di base del testo usate da Genie per elaborare e comprendere la lingua. Il testo incluso come istruzioni o metadati in uno spazio Genie viene convertito in token. Se il numero di token nel tuo spazio sta per raggiungere il limite, il prodotto fornisce avvisi. Genie applica il filtro del contesto intelligente per selezionare i token che rappresentano i metadati e alcuni tipi di istruzioni inclusi nello spazio Genie. Anche se si supera il limite, lo spazio deve continuare a generare risposte alle domande.

Se lo spazio Genie si avvicina al limite di token, Genie potrebbe classificare in ordine di priorità solo le parti dello schema di tabella e le istruzioni più rilevanti per la domanda. Ciò può ridurre la qualità della risposta se il contesto importante viene filtrato. Considerare le procedure seguenti per ridurre il numero di token:

  • Rimuovere le colonne non necessarie: le colonne non necessarie nelle tabelle possono contribuire in modo significativo all’utilizzo dei token. è possibile creare visualizzazioni per escludere campi ridondanti o non essenziali dalle tabelle non elaborate. È anche possibile nascondere le colonne non richieste in uno spazio Genie. Vedi Mostra o nascondi colonne.
  • Semplificare le descrizioni delle colonne: mentre le descrizioni delle colonne sono importanti, evitare di duplicare le informazioni già trasmesse dai nomi delle colonne. Ad esempio, se una colonna è denominata account_name, una descrizione come “il nome dell'account” potrebbe essere ridondante e può essere omessa.
  • Modificare i metadati delle colonne nello spazio Genie: vedere Modificare i metadati delle colonne per informazioni su come modificare le descrizioni e fornire sinonimi nei metadati delle colonne.
  • Ridurre le istruzioni SQL di esempio: includere un insieme diversificato di istruzioni SQL di esempio per coprire vari tipi di domande, ma rimuovere gli esempi sovrapposti o ridondanti.
  • Semplificare le istruzioni: verificare che le istruzioni siano chiare e concise. Evitare parole non necessarie.

L'account non è abilitato per l'elaborazione tra aree geografiche

Genie è un servizio designato gestito da Azure Databricks. I servizi designati usano Databricks Geos per gestire la residenza dei dati. I dati non possono essere elaborati nella stessa area geografica dell'area di lavoro per alcune aree. Se l'area di lavoro si trova in una di queste aree, l'elaborazione tra aree deve essere abilitata dall'amministratore dell'account.

Raggiungimento dei limiti di velocità effettiva

Quando si accede agli spazi Genie tramite l'interfaccia utente di Azure Databricks, la velocità effettiva è limitata a 20 domande al minuto per area di lavoro, in tutti gli spazi Genie.

Quando si accede agli spazi Genie usando il livello gratuito dell'API conversazione (anteprima pubblica), la velocità effettiva è limitata a cinque domande al minuto per ogni area di lavoro, in tutti gli spazi Genie. Vedere Usare l'API Genie Conversation per integrare Genie nelle applicazioni.