Condividi tramite


Risolvere i problemi relativi agli spazi Genie

Questa pagina illustra come risolvere i problemi comuni durante la creazione e la gestione degli spazi Genie.

Gergo professionale frainteso

La maggior parte delle aziende o dei domini ha una sintassi abbreviata specifica usata per comunicare eventi specifici dell’azienda. Ad esempio, quando si fa riferimento a un anno, potrebbe sempre significare l’anno fiscale e l’anno fiscale potrebbe iniziare a febbraio o marzo anziché a gennaio. Per consentire a Genie di rispondere a queste domande in modo naturale e accurato, includere istruzioni che eseguono il mapping esplicito del gergo aziendale a parole e concetti che Genie può comprendere. Vedi Fornire istruzioni.

Utilizzo errato della tabella o della colonna

Se Genie tenta di eseguire il pull dei dati da una tabella non corretta o di eseguire analisi su colonne non corrette, è possibile modificare i dati in uno dei modi seguenti:

  • Fornire descrizioni chiare e precise: controllare le tabelle e i metadati associati per verificare che la terminologia usata corrisponda alla terminologia degli utenti nelle domande inviate. In caso contrario, perfezionare la descrizione o aggiungere un’istruzione che esegue il mapping della terminologia usata nella tabella alla terminologia usata nella domanda.
  • Aggiungere query di esempio: fornire query SQL di esempio che Genie può utilizzare per imparare a rispondere a determinate domande. Vedi Fornire istruzioni.
  • Rimuovere tabelle o colonne dallo spazio: alcune tabelle possono includere colonne o concetti sovrapposti che rendono difficile per Genie conoscere i dati da utilizzare in una risposta. Se possibile, rimuovere tabelle o colonne non necessarie o sovrapposte. Per nascondere le colonne dall'interfaccia utente dello spazio Genie senza modificare gli oggetti dati sottostanti, vedere Nascondere o visualizzare colonne pertinenti.

Errori di filtro

Le query generate spesso includono una WHERE clausola per filtrare i risultati in base a un valore specifico. Quando Genie non ha visibilità sui valori dei dati, potrebbe impostare la WHERE clausola per filtrare il valore errato. Ad esempio, potrebbe provare a trovare la corrispondenza con il nome "California" quando la tabella usa abbreviazioni come "CA".

Per situazioni come questa, verificare che le colonne pertinenti abbiano valori di esempio e dizionari valore abilitati. Se sono stati aggiunti nuovi dati alle tabelle pertinenti, aggiornare i valori. Vedere Creare un archivio conoscenze per spazi Genie più affidabili.

Join non corretti

Se i riferimenti alle chiavi esterne non sono definiti nel Catalogo Unity, potrebbe non sapere come unire le tabelle diverse.

Provare almeno una fra le seguenti soluzioni:

  • Definire i riferimenti di chiave esterna nel Catalogo Unity quando possibile. Vedere la clausola CONSTRAINT.
  • Se le relazioni di chiave esterna delle tabelle non vengono specificate in Unity Catalog, definire le relazioni di join nell'archivio conoscenze dello spazio Genie. Questa strategia è utile per scenari di join più complessi, ad esempio self-join o se non si dispone di autorizzazioni sufficienti per modificare le tabelle sottostanti. Vedere Definire le relazioni di join.
  • Fornire esempi di query in cui si effettua un join delle tabelle in modo standard.

Se nessuna di queste soluzioni risolve il problema, unire anticipatamente la tabella in una vista e usarla come input per lo spazio.

Commenti di colonna non sincronizzati da tabelle esterne

Azure Databricks non gestisce i metadati, i dati o la semantica per le scritture in tabelle esterne. A seconda della tabella di origine, i commenti potrebbero non essere accessibili da Azure Databricks. Per rendere disponibili i commenti, Azure Databricks consiglia di eseguire una delle operazioni seguenti:

  • Modificare i metadati delle colonne nell'interfaccia utente dello spazio Genie. I metadati modificati si applicano solo allo spazio Genie in cui è scritto. Vedere Modificare i metadati della colonna.
  • Creare viste materializzate sopra le tabelle federate. È possibile aggiungere e modificare commenti in una vista materializzata come si farebbe in una tabella gestita. È possibile riutilizzare questa visualizzazione in più spazi Genie. Per informazioni dettagliate sul caricamento di dati da tabelle esterne a una vista materializzata, vedere Caricare dati da tabelle esterne con viste materializzate. Per altre informazioni sull'uso di viste materializzate, vedere Viste materializzate.

Problemi di calcolo delle metriche

Il modo in cui vengono calcolate le metriche e l'aggregazione dei dati può essere arbitrariamente complicato e includere molti dettagli aziendali che la tua area non comprende. Ciò può causare una segnalazione errata.

Provare almeno una fra le seguenti soluzioni:

  • Definire le metriche come espressioni SQL nell'archivio conoscenze. Le espressioni SQL forniscono definizioni riutilizzabili e precise per misure, filtri e dimensioni che Genie può applicare in modo coerente. Vedere Definire espressioni SQL.
  • Se le metriche vengono aggregate dalle tabelle di base, fornire query SQL di esempio che calcolano ogni valore di rollup.
  • Se le metriche sono state pre-calcolate e si trovano in tabelle aggregate, spiegarne le informazioni nei commenti delle tabelle. Specificare aggregazioni valide per ogni metrica se è possibile eseguire il rollup delle metriche in tale tabella.
  • Se SQL che stai cercando di generare è molto complicato, prova a creare viste che hanno già aggregato le metriche per il tuo spazio.

Calcoli basati sul tempo non corretti

Genie potrebbe non essere sempre in grado di dedurre il fuso orario rappresentato nei dati o nel fuso orario in cui l'analisi deve essere eseguita, a meno che non si forniscano in modo esplicito indicazioni aggiuntive.

Includere istruzioni più esplicite che illustrano in dettaglio il fuso orario di origine originale, la funzione di conversione e il fuso orario di destinazione. Gli esempi seguenti illustrano come modificare le istruzioni generali per conversioni di fuso orario più affidabili:

  • Convertire sempre le ore in un fuso orario specifico: in questo esempio si supponga che il timestamp di origine sia UTC e si vogliano ottenere i risultati nel fuso orario America/Los_Angeles. Aggiungere quanto segue alle istruzioni, sostituendo <timezone-column> con il nome di colonna appropriato:
    • I fusi orari nelle tabelle si trovano in UTC.
    • Convertire tutti i fusi orari usando la funzione seguente: convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>).
  • Convertire i formati datetime non UTC in UTC: se il fuso orario predefinito dell'area di lavoro è UTC ma gli utenti di Los Angeles devono fare riferimento a oggi per un set specifico di record, aggiungere quanto segue alle istruzioni generali dello spazio:
    • Per fare riferimento a oggi, usare date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp())).

Vedere la funzione convert_timezone.

Ignorare le istruzioni

Anche se hai spiegato le tue tabelle e colonne nei commenti e fornito istruzioni generali, il tuo spazio potrebbe comunque non utilizzarle correttamente.

Provare almeno una fra le seguenti operazioni:

  • Fornire query di esempio che usano correttamente le tabelle. Le query di esempio sono particolarmente efficaci per insegnare al tuo sistema come sfruttare i tuoi dati.
  • Nascondere colonne irrilevanti nello spazio Genie. Vedere Nascondere o visualizzare le colonne pertinenti.
  • Crea viste dalle tue tabelle che offrono una visualizzazione più semplice dei tuoi dati.
  • Esaminare le istruzioni e provare a concentrare lo spazio rimuovendo tabelle o istruzioni irrilevanti.
  • Provare ad avviare una nuova chat. Le interazioni precedenti potrebbero influenzare le risposte di Genie in una determinata chat, ma l'avvio di una nuova chat offre un punto di partenza vuoto per testare nuove istruzioni.

Problemi di prestazioni

Quando Genie deve generare query o risposte di testo estremamente lunghe, può richiedere un tempo considerevole per rispondere o persino andare in timeout durante la fase di elaborazione.

Provare una o più delle azioni seguenti per migliorare le prestazioni:

  • Controllare la cronologia delle query per identificare le query a esecuzione lenta. Molti problemi di prestazioni possono essere risolti ottimizzando le query SQL generate anziché modificando la configurazione dello spazio Genie. Esaminare i tempi di esecuzione delle query e i piani di query nella cronologia delle query di SQL Warehouse per identificare colli di bottiglia e opportunità di ottimizzazione.
  • Utilizzare asset o viste attendibili per incapsulare query complesse. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.
  • Ridurre la lunghezza delle query SQL di esempio quando possibile.
  • Avviare una nuova chat se Genie inizia a generare risposte lente o non riuscite.

Risposte inaffidabili alle domande cruciali

Utilizzare gli asset attendibili per fornire risposte verificate a domande specifiche che si prevede vengano poste dagli utenti. Vedere Utilizzare asset attendibili in spazi di IA/BI Genie.

Avviso relativo al limite di token

I token sono le unità di base del testo usate da Genie per elaborare e comprendere la lingua. Le istruzioni di testo e i metadati in uno spazio Genie vengono convertiti in token. Se lo spazio si avvicina al limite di token, viene visualizzato un avviso. Genie usa il filtro del contesto per classificare in ordine di priorità i token che considera più rilevanti per una domanda. Anche se le risposte devono essere ancora generate quando viene visualizzato un avviso, la qualità può essere ridotta se viene filtrato un contesto importante. Quando viene superato il limite di token, non è più possibile inviare o ricevere messaggi nello spazio Genie.

Considerare le procedure seguenti per ridurre il numero di token:

  • Rimuovere le colonne non necessarie: le colonne non necessarie nelle tabelle possono contribuire in modo significativo all’utilizzo dei token. Quando possibile, creare viste per escludere campi ridondanti o non essenziali dalle tabelle non elaborate. È anche possibile nascondere le colonne non richieste in uno spazio Genie. Vedere Nascondere o visualizzare le colonne pertinenti.
  • Semplificare le descrizioni delle colonne: mentre le descrizioni delle colonne sono importanti, evitare di duplicare le informazioni già trasmesse dai nomi delle colonne. Ad esempio, se una colonna è denominata account_name, una descrizione come "il nome dell'account" potrebbe essere ridondante e può essere omessa.
  • Modificare i metadati delle colonne nello spazio Genie: vedere Modificare i metadati delle colonne per informazioni su come modificare le descrizioni e fornire sinonimi nei metadati delle colonne.
  • Pota le query SQL di esempio: includere una vasta gamma di query SQL di esempio per coprire vari tipi di domande, ma rimuovere esempi sovrapposti o ridondanti.
  • Semplificare le istruzioni: verificare che le istruzioni siano chiare e concise. Evitare parole non necessarie.

L'account non è abilitato per l'elaborazione tra aree geografiche

Genie è un servizio designato gestito da Azure Databricks. I servizi designati usano Databricks Geos per gestire la residenza dei dati. I dati non possono essere elaborati nella stessa area geografica dell'area di lavoro per alcune aree. Se l'area di lavoro si trova in una di queste aree, l'elaborazione tra aree deve essere abilitata dall'amministratore dell'account.

Raggiungimento dei limiti di velocità effettiva

Quando si accede agli spazi Genie tramite l'interfaccia utente di Azure Databricks, la velocità effettiva è limitata a 20 domande al minuto per area di lavoro, in tutti gli spazi Genie.

Quando si accede agli spazi Genie usando il livello gratuito dell'API conversazione (anteprima pubblica), la velocità effettiva è limitata a cinque domande al minuto per ogni area di lavoro, in tutti gli spazi Genie. Vedere Usare l'API Genie per integrare Genie nelle applicazioni.