Condividi tramite


Creare un archivio conoscenza per spazi Genie più affidabili

L'archivio conoscenze Genie consente di curare e migliorare lo spazio tramite metadati localizzati, campionamento dei valori e istruzioni SQL strutturate. Queste funzionalità consentono a Genie di comprendere i dati e generare risposte più accurate e pertinenti.

Che cos'è un archivio conoscenze?

Un archivio conoscenze è una raccolta di definizioni semantiche curate che migliorano la comprensione dei dati di Genie e migliorano l'accuratezza della risposta.

L'archivio conoscenze è costituito da:

  • Personalizzazione dei metadati a livello di spazio: descrizioni specifiche dello spazio per tabelle, colonne e termini aziendali e sinonimi
  • Personalizzazione dei dati a livello di spazio: set di dati semplificati e incentrati senza modificare le tabelle del catalogo Unity sottostanti
  • Campionamento dei valori: esempi di dati reali che aiutano Genie a comprendere i tipi di dati e a collegare i prompt degli utenti ai valori reali
  • Relazioni di join: Relazioni di tabella ben definite per istruzioni accurate JOIN
  • Espressioni SQL: definizioni strutturate di misure, filtri e dimensioni che acquisiscono la logica aziendale

Tutte le configurazioni dell'archivio conoscenze hanno come ambito lo spazio Genie e non influiscono sui metadati del catalogo Unity o su altri asset di Azure Databricks.

Gestire i metadati dell'archivio della conoscenza

Insegnare a Genie i dati nello spazio fornendo descrizioni delle tabelle e delle colonne locali e aggiungendo sinonimi di colonna che corrispondano ai termini del settore comunemente utilizzati. Semplifica i set di dati nascondendo colonne non necessarie o duplicate per mantenere Genie concentrato.

Queste procedure migliorano l'usabilità per gli utenti che non dispongono di autorizzazioni dirette per le tabelle sottostanti e supportano anche iterazioni più rapide durante l'aggiornamento delle versioni delle istruzioni.

Per accedere ai metadati a livello di spazio, fare clic su Configura > dati nello spazio Genie. Fare quindi clic su un nome di tabella per visualizzarne i metadati e le colonne.

Visualizza le colonne

Fare clic su un nome di tabella per visualizzare una panoramica dei nomi e dei dettagli delle colonne. Nell'esempio seguente viene illustrato un esempio di una tabella denominata accounts.

Panoramica della tabella che mostra la descrizione dei metadati e i dettagli della colonna, come descritto di seguito.

  • Descrizione: Genie usa i metadati per comprendere i dati e generare risposte accurate. La descrizione della tabella predefinita mostra i metadati del catalogo Unity associati all'asset di dati. È possibile modificare questa descrizione per aggiungere indicazioni specifiche che aiutano Genie a scrivere SQL per il tuo spazio. Fare clic su Reimposta per ripristinare la descrizione del catalogo Unity.

  • Colonne: I nomi e le descrizioni delle colonne sono inclusi nell'elenco di colonne. Ogni colonna viene etichettata con tag che mostrano se include valori di esempio o un dizionario dei valori. Vedere Panoramica del campionamento dei valori.

Nascondere o visualizzare le colonne pertinenti

Le colonne possono essere gestite singolarmente o in blocco. Usare le istruzioni seguenti per nascondere o visualizzare colonne.

  • Nascondi una singola colonna: fare clic sull'icona a forma di occhio accanto al nome della colonna.
  • Nascondere più colonne:
    • Selezionare le caselle di controllo per le colonne da nascondere.
    • Scegliere Nascondi colonne selezionate dal menu Azioni.
  • Annulla modifiche: ripetere gli stessi passaggi per visualizzare una colonna nascosta.

Modificare i metadati delle colonne

È possibile personalizzare quanto segue per ogni colonna:

  • Descrizione: descrizioni di colonne specifiche dello spazio che migliorano la comprensione di Genie.
  • Sinonimi: termini aziendali e parole chiave che consentono di associare la lingua dell'utente ai nomi di colonna.
  • Impostazioni avanzate: controlli di campionamento dei valori.
    • Valori di esempio: attivare o disattivare il campionamento automatico dei valori rappresentativi.
    • Costruire dizionari di valori: abilitare o disabilitare i dizionari di valori per le colonne categoriche.

Per modificare i metadati della colonna:

  1. Fare clic sull'icona matita. Icona a forma di matita accanto a un nome di colonna.
  2. Modificare la descrizione e i sinonimi per la colonna.
  3. Se necessario, fare clic su Impostazioni avanzate per aprire i controlli di campionamento dei valori.
  4. Fare clic su Salva per mantenere le modifiche e chiudere la finestra di dialogo.

Panoramica del campionamento dei valori

Il campionamento dei valori migliora la capacità di Genie di comprendere e lavorare con i dati effettivi raccogliendo esempi rappresentativi.

Il campionamento dei valori migliora la generazione SQL di Genie fornendo l'accesso ai valori di dati reali. Quando gli utenti fanno domande di conversazione con errori di ortografia o terminologia diversa, il campionamento dei valori consente a Genie di trovare le richieste di corrispondenza con i valori effettivi dei dati nelle tabelle.

Componenti di campionamento dei valori

  • Valori di esempio: piccoli esempi di ogni colonna che consentono a Genie di comprendere i tipi di dati e la formattazione. Questi vengono raccolti automaticamente per tutte le colonne idonee.
  • Dizionari valori: elenchi curati di un massimo di 1.024 valori distinti per colonna (minori di 127 caratteri ciascuno). Creato per un massimo di 120 colonne che contengono valori di stringa categorici o formattati in modo coerente, ad esempio stati, categorie di prodotti o codici di stato.

Le tabelle con filtri di riga o maschere di colonna vengono escluse dal campionamento dei valori.

Gestire il campionamento dei valori

Controllare quali colonne forniscono valori di esempio e dizionari di valori per ottimizzare la comprensione dei dati di Genie. Il campionamento dei valori è abilitato per impostazione predefinita per tutti gli spazi Genie.

Gestire valori di esempio

I valori di esempio vengono aggiunti automaticamente quando si aggiungono tabelle a uno spazio Genie.

Per disattivare i valori di esempio per una colonna:

  1. Fare clic su Configura > dati nello spazio Genie.
  2. Fare clic sul nome di una tabella per visualizzarne le colonne.
  3. Fare clic sull'icona a forma di matita. Icona a forma di matita accanto al nome della colonna.
  4. Fare clic su Avanzate.
  5. Disattiva valori di esempio .

Questa azione disabilita automaticamente la compilazione di un dizionario di valori per tale colonna. Se necessario, usare questa impostazione per riattivare i valori di esempio .

Configurare dizionari di valori

Genie seleziona automaticamente le colonne per il campionamento dei valori quando si aggiungono dati a uno spazio. È possibile gestire manualmente le colonne con dizionari valore abilitati. Scegliere le colonne stringa con valori categorici o strutturati per ottenere risultati ottimali. Evitare colonne di testo libero, ad esempio ID utente, nomi o recensioni utente.

Genie impedisce di abilitare dizionari di valori nelle tabelle con filtri di riga o maschere di colonna. Tuttavia, gli autori di spazi devono disabilitare i dizionari valori per le viste che fanno riferimento a tabelle con filtri di riga o maschere di colonna o per le visualizzazioni dinamiche.

L'elenco seguente include esempi dei tipi di dati che funzionano bene con i dizionari valore:

  • Codici di stato o paese
  • Categorie di prodotti
  • Codici di stato
  • Nomi di reparto

Per abilitare un dizionario valori:

  1. Fare clic sull'icona a forma di matita. Icona a forma di matita accanto al nome della colonna.
  2. Fare clic su Avanzate.
  3. Attivare il dizionario dei valori di compilazione .

Una colonna stringa con il pulsante del dizionario di valori sulla destra.

Aggiornare i valori di esempio

L'aggiornamento dei valori di esempio interroga nuovamente i tuoi dati e raccoglie nuovi valori per i valori di esempio e i dizionari di valori.

È consigliabile aggiornare i valori di esempio nei casi seguenti:

  • Alla colonna sono stati aggiunti nuovi valori
  • Il formato dei valori esistenti è stato modificato

Per aggiornare i valori archiviati:

  1. Fare clic sull'icona del menu Kebab. nella visualizzazione a colonne
  2. Selezionare Aggiorna valori di esempio

Aggiornare i valori o rimuovere le opzioni dei valori nell'interfaccia utente

Definire le relazioni di join

Aiutare Genie a creare istruzioni accurate JOIN definendo le relazioni tra tabelle:

  1. Fare clic su Join.
  2. Fare clic su Aggiungi.
  3. Selezionare tabelle a sinistra e a destra nei menu a discesa.
  4. Immettere una condizione join (ad esempio, accounts.id = opportunity.accountid)
    • (Facoltativo) Per condizioni di join più complesse, usare un'espressione SQL. Fare clic su Usa espressione SQL e quindi registrare la condizione di join come espressione SQL.
  5. Selezionare un tipo di relazione:
    • Molti-a-uno: più righe a sinistra vengono mappate a una riga a destra
    • Uno-a-molti: una riga a sinistra corrisponde a più righe a destra
    • Uno a uno: una riga di sinistra mappa al massimo a una riga di destra

Istruzioni di join che mostrano una relazione di join identificata

Annotazioni

Quando vengono usati più join tra le stesse tabelle o self-join, Genie genera automaticamente alias per la tabella di destra per evitare ambiguità.

Ottenere suggerimenti dal feedback

Quando gli utenti fanno clic su 'mi piace' su un messaggio che combina tabelle o utilizza espressioni SQL, Genie analizza la risposta e può suggerire nuovi frammenti SQL (ad esempio, misure, join o filtri) per gli autori degli spazi da esaminare e aggiungere alla base di conoscenza. Genie non impara o modifica automaticamente il suo comportamento in base al feedback.

Definire espressioni SQL

Interfaccia delle espressioni SQL che mostra misure, filtri e dimensioni

Le espressioni SQL offrono un modo strutturato e guidato per insegnare a Genie i termini aziendali comuni, ad esempio kpi, attributi e condizioni. Genie può quindi usare ognuna di queste definizioni granulari quando un utente le chiede.

Le espressioni SQL completano le query SQL di esempio, specificate nelle istruzioni. Mentre le espressioni SQL definiscono concetti aziendali riutilizzabili, le query SQL di esempio sono più utili per insegnare a Genie come approcciare i formati comuni dei prompt degli utenti. Ad esempio, se gli utenti richiedono in genere "una suddivisione delle prestazioni", una query SQL di esempio può indicare che ciò significa vendite chiuse per area, rappresentante vendite e responsabile.

Le espressioni SQL funzionano al meglio quando è necessario:

  • Fornire definizioni strutturate per indicatori KPI e metriche, ad esempio il margine di profitto o il tasso di conversione
  • Assegnare a Genie un contesto esplicito su come calcolare valori importanti
  • Definire dimensioni aggiuntive per il set di dati, ad esempio mese o segmento di clienti
  • Insegnare a Genie a filtrare per condizioni aziendali, come ordini di grandi dimensioni o ordini prima di un momento specifico

Tipi di espressione SQL

È possibile definire i tipi di espressioni SQL seguenti:

  • Misure: indicatori di prestazioni chiave (KPI) e metriche. Definire il nome, il calcolo SQL e i sinonimi.
  • Filtri: condizioni di filtro comuni. Definire il nome, la logica di filtro SQL e i sinonimi.
  • Dimensioni: attributi per il raggruppamento e l'analisi dei dati. Definire il nome, l'espressione SQL e i sinonimi.

Usare le istruzioni seguenti per definire espressioni SQL:

  1. Fare clic su Configura>Istruzioni>Espressioni SQL
  2. Fare clic su Aggiungi. Scegliere Filtro, Misura o Dimensione.
  3. Nel campo Nome immettere un nome per l'espressione.
  4. Nel campo Codice immettere l'espressione SQL.
  • Le espressioni di filtro devono restituire una condizione booleana.
  • Le espressioni di misura devono calcolare un'aggregazione su più righe nella tabella.
  • Le espressioni di dimensione devono modificare il valore di ogni riga dai dati esistenti.
  1. Nel campo Sinonimi immettere modi comuni che gli utenti possono fare riferimento alle espressioni colloquialmente.
  2. Nel campo Istruzioni immettere istruzioni specifiche che indicano a Genie qual è l'espressione e come usarla.

Passaggi successivi

Usare i collegamenti seguenti per continuare a creare lo spazio Genie.