Sdílet prostřednictvím


Co je prostor AI/BI Genie

Tato stránka představuje AI/BI Genie, což je funkce Azure Databricks, která umožňuje obchodním týmům pracovat s daty pomocí přirozeného jazyka. Využívá generující AI přizpůsobenou terminologii a datům vaší organizace s možností sledovat a upřesňovat jeho výkon prostřednictvím zpětné vazby uživatelů.

Přehled

Odborníci na domény, jako jsou datoví analytici, konfigurují prostory Genie s datovými sadami, ukázkovými dotazy a textovými pokyny, které Genie pomáhají překládat obchodní otázky do analytických dotazů. Po nastavení můžou firemní uživatelé klást otázky a generovat vizualizace, aby porozuměli provozním datům. Sémantické znalosti Genie můžete průběžně aktualizovat, protože vaše data se mění a uživatelé představují nové otázky. Další informace o funkcích využívajících AI služby Databricks najdete v tématu Funkce využívající AI služby Databricks.

AI/BI Genie vybere relevantní názvy a popisy z anotovaných tabulek a sloupců a převede otázky v přirozeném jazyce na ekvivalentní dotaz SQL. Pokud je to možné, odpoví vygenerovaným dotazem a tabulkou výsledků. Pokud Genie nemůže vygenerovat odpověď, může se zeptat na následné otázky, které upřesní před poskytnutím odpovědi.

Příklady případů použití

Můžete vytvořit různé prostory Genie, které budou sloužit různým jiným než technickým cílovým skupinám. Následující scénáře popisují dva možné případy použití.

Příklad 1: Vizualizace stavu příležitosti

Manažer prodeje chce získat aktuální stav otevřených a uzavřených příležitostí podle fáze v prodejním kanálu. Můžou pracovat s prostorem Genie pomocí přirozeného jazyka a automaticky vygenerovat vizualizaci.

Následující obrázek gif znázorňuje tuto interakci:

Gif s ukázkovou otázkou, odpovědí a automaticky vygenerovanou vizualizací

Příklad 2: Sledování logistiky

Logistická společnost chce používat Prostory Genie k tomu, aby firemním uživatelům z různých oddělení pomohla sledovat provozní a finanční podrobnosti. Nastavili prostor Genie pro své manažery přepravních zařízení, aby mohli sledovat zásilky a další pro finanční manažery, aby porozuměli svému finančnímu zdraví.

Jaká data mám použít?

Prostor Genie je založený na datech zaregistrovaných v katalogu Unity, včetně spravovaných tabulek, externích tabulek, cizích tabulek, zobrazení, zobrazení metrik a materializovaných zobrazení. AI/BI Genie používá k vygenerování odpovědí metadat připojená k objektům katalogu Unity a také autorově kurátorovanému úložišti znalostí na úrovni prostoru. Dobře anotované datové sady spárované s konkrétními pokyny, které poskytnete, jsou klíčem k vytvoření pozitivního prostředí pro koncové uživatele.

Nahrávání souborů

Důležité

Tato funkce je ve verzi Public Preview.

Nahrávání souborů umožňuje uživatelům kombinovat místní soubory CSV a Excel s daty katalogu Unity a odpovídat na otázky. Pokud chcete povolit nahrávání souborů, obraťte se na tým účtu Databricks. Další informace najdete v tématu Nahrání souboru.

Jak Genie funguje

Genie používá složený systém AI k interpretaci obchodních otázek a generování odpovědí. Místo použití jednoho velkého jazykového modelu zpracovávají složené systémy AI úlohy v aplikacích AI kombinací více interagujících komponent. Složené systémy AI jsou stále častějším vzorem návrhu pro aplikace umělé inteligence z důvodu jejich výkonu a flexibility. Další informace naleznete v tématu Přechod z modelů na složené systémy AI.

Co je Genieovo úložiště znalostí?

Autoři Genie můžou přidat metadata specifická pro společnost přímo do datových prostředků v prostoru Genie. To zahrnuje popisy metadat tabulek a sloupců, synonyma na úrovni sloupců, vzorkované hodnoty a slovníky hodnot, které Genie při generování odpovědí konzultuje. Podrobná vrstva metadat pomáhá Genie načíst správné informace a získat přesnější výsledky.

Jak Genie vygeneruje odpověď?

Když uživatel odešle otázku, Genie žádost analyzuje, identifikuje relevantní zdroje dat a určí, jak na výzvu odpovědět. Podrobnosti, které autoři poskytují v kombinaci s metadaty katalogu Unity, umožňují Genie odvodit obchodní i technickou logiku. Genie inteligentně filtruje ukázkové dotazy SQL, metadata tabulek a sloupců a historii chatu a vybere nejrelevavantnější informace pro zodpovězení požadavku.

Genie používá k vygenerování odpovědí následující komponenty:

  • Metadata tabulky katalogu Unity: Zahrnuje názvy tabulek, popisy a definované relace primárního klíče (PK) a cizího klíče (FK). Genie použije tato data při analýze požadavku a převede výzvu přirozeného jazyka na SQL.
  • Názvy a popisy sloupců: Genie inteligentně filtruje relevantní názvy sloupců a popisy, které se mají zahrnout.
  • Kontext úložiště znalostí: Autoři můžou místně upravovat metadata tabulky pro prostředky používané v prostoru Genie. To pomáhá Genie generovat přesnější odpovědi a nemění stávající metadata katalogu Unity. Viz Nastavení a správa prostoru AI/BI Genie.
  • Příklady dotazů SQL: Genie inteligentně vybere relevantní příklady SQL z dotazů SQL.
  • funkce SQL: Všechny funkce SQL přidané do prostoru.
  • Pokyny: Poznámky ve formátu prostého textu, poskytnuté jako obecné instrukce, jsou zahrnuty jako kontext.
  • historie výzev a odpovědí: Výzvy a odpovědi z aktuálního chatu jsou zahrnuty jako kontext. V případě potřeby jsou kvůli nastaveným omezením tokenů vyloučeny nejstarší části záznamu chatu.

Poznámka:

Některé podrobnosti tabulky, například vlastník a velikost tabulky, nejsou ve výchozím nastavení zahrnuty. Pro přístup k tomuto informacím použijte zobrazení ze schématu informací dostupného pro všechny katalogy Unity. Výchozí zobrazení můžou obsahovat nepotřebné podrobnosti, takže vytvoření vlastního zobrazení nad tím, které vám může pomoct zaměřit se na konkrétní informace, které potřebujete. Další informace o tom, co je k dispozici v informačním schématu, naleznete v tématu Schéma informací.

V mnoha případech Genie vygeneruje dotaz SQL, který běží ve službě SQL Warehouse v prostoru. Generované dotazy jsou vždy jen pro čtení. Opakované pokusy se zpracovávají automaticky a SQL sklad zpracovává souběžnost a škálování. Sada výsledků se zobrazí jako součást odpovědi.

Nastavte prostředí Genie

Můžete vytvořit prostor Genie, pokud máte:

  • Oprávnění pro Databricks SQL.
  • Alespoň MŮŽE POUŽÍT oprávnění pro pro nebo bezserverový SQL Warehouse.
  • SELECT Alespoň oprávnění pro jeden nebo více objektů dat Katalogu Unity.

Viz Nastavení a správa prostoru AI/BI Genie.

Interakce s prostorem Genie

Obchodní týmy jsou koncovými uživateli prostoru Genie. Aby mohli používat prostor Genie, musí mít podnikoví uživatelé:

  • Uživatelský přístup nebo oprávnění Databricks SQL.
  • Alespoň OPRÁVNĚNÍ CAN USE u výchozího skladu určeného pro prostor Genie.
  • SELECT Alespoň oprávnění ke všem datovým objektům katalogu Unity používaným v prostoru.

Podnikoví uživatelé mohou pomoci při vytváření prostředí tím, že ho testují a poskytují zpětnou vazbu během vývoje. Další informace o tom, jak můžou podnikoví uživatelé začít pracovat s prostorem Genie, najdete v tématu Použití prostoru Genie k prozkoumání obchodních dat.

Důvěryhodné prostředky

Důvěryhodné zdroje poskytují uživateli kosmického prostoru další vrstvu jistoty ohledně přesnosti výsledku. Když je k vygenerování odpovědi použit přesný text parametrizovaného dotazu nebo SQL funkce, Genie označí odpověď jako Bezpečná. Další informace o důvěryhodných prostředcích najdete v tématu Použití důvěryhodných prostředků v prostorech AI/BI Genie . Další informace o práci s parametrizovanými dotazy najdete v tématu Použití parametrů v dotazech SQL .

Vyhodnocení odpovědí pomocí srovnávacích testů

Srovnávací testy umožňují vertikálně navýšit kapacitu testování a hodnocení jednotlivých odpovědí v prostoru Genie. Na rozdíl od pokynů jsou srovnávací testy určeny k hodnocení, nikoli k informování, prostoru Genie. Genie nepoužívá srovnávací dotazy ani příklady SQL k vylepšení svého kontextu.

Pomocí srovnávacích testů můžete spustit kolekci testovacích otázek a použít odpovědi k měření přesnosti Genie. Volitelně můžete zahrnout příkaz SQL, který vrátí očekávané výsledky. Když se spustí testovací otázka, porovná se odpověď Genie s výsledky poskytnutými příkazem SQL a je hodnocena z hlediska přesnosti. Pokud nebyla zadána žádná odpověď SQL, je tato otázka označena ke kontrole.

Viz Použití srovnávacích testů v prostoru Genie.

Ochrana osobních údajů a zabezpečení

Otázka: Jaký model Genie používá?

Genie je funkce založené na umělé inteligenci Databricks. Používá složený systém AI, který kombinuje použití modelů AI, načítání, řazení a přizpůsobení, aby porozuměla vzorům využití a dat vaší organizace. Další informace najdete v tématu Funkce založené na AI služby Databricks.

Otázka: Jaká data se do modelu odesílají?

Genie používá při generování odpovědi výzvu, relevantní metadata a hodnoty tabulek, chyby a také vstupní kód nebo dotazy.

Ke zpracování odpovědí používá Genie následující:

  • Výzva k přirozenému jazyku odeslaná uživatelem
  • Názvy a popisy tabulek
  • Názvy sloupců, popisy a ukázkové hodnoty
  • Obecné pokyny
  • Příklady dotazů SQL
  • Funkce SQL

Otázka: Ukládá Azure OpenAI moje data?

Ne. Při použití modelů Azure OpenAI prostřednictvím Databricks Microsoft neukládá výzvy ani odpovědi na libovolnou dobu, a to ani v síťových protokolech. To zahrnuje data, která by se normálně používala k monitorování zneužití. Databricks se odhlásila z monitorování zneužití Azure OpenAI a kontroly lidí, takže Microsoft neuchovává ani nekontroluje žádná data odesílaná Genie. Další informace najdete v dokumentaci Microsoftu.

Q: Kde jsou uloženy odpovědi Genie?

Odezvy Genie jsou ukládány v řídicím plánu Azure Databricks.

Otázka: Podporuje se filtrování na úrovni řádků v prostoru Genie?

Ano, oprávnění udělená v katalogu Unity řídí, kteří uživatelé mají přístup ke konkrétním datovým objektům. Pokud se filtry řádků nebo masky sloupců použijí u datového objektu, určují, které hodnoty se vrátí v sadě výsledků. Viz filtry řádků a masky sloupců.

Otázka: Jak je můj provoz směrován přes Geos?

  • Genie je nasazená v USA, EU, AUS a Indii.

  • Směrování provozu závisí na vaší oblasti a na tom, jestli je povolené zpracování mezi geografickými oblastmi (Vynucení zpracování dat v rámci zeměpisu pracovního prostoru pro určené služby je zakázané):

    • EU: Provoz se vždy směruje přes EU bez ohledu na přeshraniční zpracování.
    • USA: Provoz se vždy směruje přes USA, bez ohledu na geografické zpracování.
    • Indie a AUS:
      • Pokud je zpracování napříč geografickou oblastí zakázané: Provoz je zaručený, že zůstane ve vaší oblasti.
      • Pokud je povolené zpracování mezi oblastmi: Provoz je vždy směrován přes USA.
    • Všechny ostatní oblasti:
      • Pokud je křížové zpracování zakázané: Genie nebude fungovat.
      • Pokud je povoleno zpracování mezi geografickými oblastmi: Provoz směruje přes USA.