Mi az a Genie Space?

Ez az oldal bemutatja a Genie Spacest, egy Azure Databricks funkciót, amellyel az üzleti csapatok természetes nyelven kezelhetik az adataikat. A szervezet terminológiájára és adataira szabott generatív AI-t használ, amely lehetővé teszi a teljesítmény monitorozását és finomítását a felhasználói visszajelzések segítségével.

Áttekintés

A tartományi szakértők, például az adatelemzők, adathalmazokkal, minta lekérdezésekkel és szöveges irányelvekkel konfigurálják a Genie Spacest, hogy segítsenek a Genie-nek üzleti kérdéseket elemzési lekérdezésekké alakítani. A beállítás után az üzleti felhasználók kérdéseket tehetnek fel, és vizualizációkat hozhatnak létre a működési adatok megértéséhez. Folyamatosan frissítheti Genie szemantikai tudását az adatok változásakor, és a felhasználók új kérdéseket tehetnek fel. A Databricks AI-alapú funkcióival kapcsolatos további információkért lásd a Databricks AI kisegítő funkcióit.

A Genie a jegyzetekkel ellátott táblákból és oszlopokból kiválasztja a megfelelő neveket és leírásokat, hogy a természetes nyelvi kérdéseket egyenértékű SQL-lekérdezéssé konvertálja. Ezután a létrehozott lekérdezéssel és eredménytáblával válaszol, ha lehetséges. Ha Genie nem tud választ adni, feltehet további kérdéseket, hogy tisztázza a választ, mielőtt választ ad.

Példák az alkalmazási helyzetekre

Különböző Genie-tereket hozhat létre a különböző nem technikai célközönségek kiszolgálásához. Az alábbi forgatókönyvek két lehetséges használati esetet írnak le.

1. példa: A legkelendőbb termék megjelenítése

Egy értékesítési vezető szeretné megérteni, hogy az idő során melyik termék a legkelendőbb a pékségükben. Természetes nyelven kommunikálhatnak a Genie-térrel, és automatikusan vizualizációt hozhatnak létre.

Az alábbi GIF a következő interakciót mutatja be:

Gif mintakérdéssel, válaszsal és automatikusan létrehozott vizualizációval

2. példa: A logisztika nyomon követése

Egy logisztikai vállalat a Genie Spaces használatával szeretné segíteni a különböző részlegek üzleti felhasználóit a működési és pénzügyi adatok nyomon követésében. Létrehoznak egy Genie Space-t a szállítási létesítmény vezetőinek a szállítmányok nyomon követésére, egy másikat pedig a pénzügyi vezetők számára, hogy megértsék a pénzügyi állapotukat.

Milyen adatokat használjak?

A Genie-tér a Unity Katalógusban regisztrált adatokon alapul, beleértve a felügyelt táblákat, a külső táblákat, az idegen táblákat, a nézeteket, a metrikanézeteket és a materializált nézeteket. Genie a Unity Catalog-objektumokhoz csatolt metaadatokat, valamint egy szerző által válogatott, térszintű tudástárat használ a válaszok létrehozásához. A jól jegyzett adathalmazok, amelyeket az Ön által megadott utasításoknak megfelelően adnak meg, kulcsfontosságúak ahhoz, hogy pozitív élményt teremtsen a végfelhasználók számára.

Megjegyzés

A Genie csak strukturált adatokkal működik. Nem tud válaszolni a strukturálatlan adatokkal, például PDF-fájlokkal, Word dokumentumokkal vagy más fájlalapú tartalommal kapcsolatos kérdésekre. Ha genie-nek hozzáférést szeretne adni strukturálatlan dokumentumokhoz, használja a Chat in Genie, amely külső dokumentumforrásokhoz, például a Google Drive-hoz vagy SharePoint csatlakozhat.

Fájlfeltöltések

Fontos

Ez a funkció nyilvános előzetes verzióban van.

A fájlfeltöltések lehetővé teszik a felhasználók számára, hogy a helyi CSV- és Excel-fájlokat a Unity Katalógus adataival kombinálva válaszoljanak a kérdésekre. A fájlfeltöltés engedélyezéséhez forduljon a Databricks-fiók csapatához. További információ: Fájl feltöltése.

A Genie működése

Genie egy összetett AI-rendszert használ, az üzleti kérdések értelmezéséhez és válaszok létrehozásához. Egyetlen nagy nyelvi modell használata helyett összetett AI-rendszerek dolgozzák fel a feladatokat az AI-alkalmazásokban több interakciós összetevő kombinálásával. Az összetett AI-rendszerek a teljesítményük és rugalmasságuk miatt egyre gyakoribb tervezési mintát jelentenek az AI-alkalmazásokban. További információért lásd: A modellekről az összetett MI rendszerekre való áttérés.

Nyelvi támogatás

A Dzsinn az angoltól eltérő nyelveken is használható, például portugál és francia nyelven. Az alapul szolgáló ügynök-keretrendszer azonban angol nyelven burkolja a kéréseket.

A Databricks azt javasolja, hogy a térkészítők a lehető legtöbb metaadatot adjanak hozzá a választott nyelven. A genie-válaszok néha angolul is megjelenhetnek a mögöttes rendszerkérések miatt.

Mi a Genie tudástára?

Genie tudástára lehetővé teszi a szerzők számára, hogy:

  • Metaadatok helyi szerkesztése: A genie-szerzők térspecifikus metaadatokat adhatnak az adategységekhez. Tartalmazhat például a tér felhasználási módjával kapcsolatos vállalatspecifikus információkat. Ide tartoznak a tábla- és oszlop metaadatainak leírásai, az oszlopszintű szinonimák és a gyors egyeztetési képességek, amelyeket a Genie a válaszok létrehozásakor keres. A részletes metaadat-réteg segít a Genie-nek a megfelelő információk lekérésében és pontosabb eredmények létrehozásában.

  • Adjon meg strukturált, részletes utasításokat: A szerzők kapcsolatokat határozhatnak meg JOIN a táblák között, hogy megtanítsák Genie-nek, hogyan hozhat létre SQL-t több táblán.

A megbízhatóbb Genie Spaces-ekhez lásd: Tudástár létrehozása.

Hogyan generálja a Genie a választ?

Amikor egy felhasználó kérdést küld, Genie elemzi a kérést, azonosítja a releváns adatforrásokat, és meghatározza, hogyan hozhat létre megfelelő választ. A szerzők által megadott részletek, valamint a Unity Catalog megfelelő megjegyzéseivel, metaadataival és a kiválasztott oszlopokból származó mintaértékekkel kombinálva lehetővé teszik a Genie számára, hogy üzleti és technikai logikát is kikövetkesszenek. További információ: A Databricks AI-segítő funkciók megbízhatósága és biztonsága, valamint a gyors egyeztetés. A Genie intelligensen szűri az SQL-lekérdezéseket, a tábla- és oszlop metaadatait és a csevegési előzményeket, hogy kiválassza a kérés megválaszolásához leginkább releváns környezetet.

A Genie a következő összetevőkkel hoz létre válaszokat:

  • Unity Catalog tábla metaadatai: Táblázatneveket, leírásokat és meghatározott elsődleges kulcsot (PK) és idegenkulcs-kapcsolatokat (FK) tartalmaz. A Genie ezeket az adatokat használja a kérés elemzésekor, és a természetes nyelvi kérést SQL-vé alakítja.
  • Oszlopnevek és -leírások: A Genie intelligensen szűri a releváns oszlopneveket és leírásokat, hogy azokat beilleszthesse.
  • Tudástár-környezet: A szerzők helyileg szerkeszthetik az eszköz metaadatait, és kiválaszthatják azokat az oszlopokat, amelyek releváns értékeket biztosítanak a Genie számára. Ez segít a Genie-nek pontosabb válaszok létrehozásában, és nem módosítja a Unity-katalógus meglévő metaadatait. A megbízhatóbb Genie Spaces-ekhez lásd: Tudástár létrehozása.
  • Példa SQL-lekérdezésekre: A Genie intelligensen kiválasztja a releváns SQL-példákat az SQL-lekérdezésekből.
  • SQL-függvények: A térben hozzáadott összes SQL-függvény.
  • utasítások: A Általános utasítások szövegként megadott egyszerű szöveges jegyzetek kontextusként szerepelnek.
  • Parancssori és válaszelőzmények: Az aktuális csevegésből érkező kérések és válaszok kontextusként jelennek meg. Ha szükséges, a token korlátokbeállítása miatt a csevegési rekord legrégebbi részei kizárásra kerülnek.

Megjegyzés

Bizonyos táblázatadatok, például a tulajdonos és a tábla mérete alapértelmezés szerint nem szerepelnek a táblázatban. Az információk eléréséhez használja az összes Unity-katalógushoz elérhető információs sémából származó nézeteket. Az alapértelmezett nézetek szükségtelen részleteket is tartalmazhatnak, így egyéni nézet létrehozása segíthet a szükséges információkra összpontosítani. Az információs sémában elérhető információkról további információt az Információs séma című témakörben talál.

A Genie sok esetben létrehoz egy SQL-lekérdezést, amely a hely SQL-raktárán fut. Az automatikusan generált lekérdezések mindig írásvédettek. Az újrapróbálkozások kezelése automatikusan megtörténik, az SQL Warehouse pedig az egyidejűséget és a skálázást kezeli. Az eredményhalmaz a válasz részeként jelenik meg.

A Genie erős biztonsági és adatvédelmi vezérlőket tart fenn. További részletekért tekintse meg a Databricks AI segítő funkcióinak megbízhatóságát és biztonságát.

A válasz pontosságának javítása az Inspect használatával

Fontos

Ez a funkció nyilvános előzetes verzióban van.

Az Inspect speciális érvelést használ a Genie által létrehozott SQL-lekérdezések pontosságának áttekintéséhez és javításához. Ha engedélyezi a válaszfüggő ellenőrzést, Dzsinn:

  1. Áttekinti az eredetileg létrehozott SQL-lekérdezést.
  2. Kisebb SQL-utasításokat készít a lekérdezés bizonyos aspektusainak ellenőrzéséhez, például:
    • Ellenőrizze, hogy a megfelelő szűrőértékek szerepelnek-e benne.
    • Dátumtartomány-logika érvényesítése, például 7 napos záróablakok.
    • Illesztési feltételek és összesítések ellenőrzése.
  3. Azonosítja az eredeti lekérdezés hiányosságait vagy lehetséges problémáit.
  4. Ha problémákat talál, egy továbbfejlesztett SQL-lekérdezést hoz létre, amely megoldja őket.
  5. Végső összehasonlítást végez az eredeti és a továbbfejlesztett lekérdezések között.
  6. Azt a lekérdezést adja vissza, amely a legpontosabban válaszol a kérdésre.

Akkor használja a Vizsgálat lehetőséget, ha nagyobb megbízhatóságot szeretne a lekérdezés pontosságában, különösen szűrőket, dátumtartományokat vagy több táblát érintő összetett lekérdezések esetén.

Genie Space beállítása

Genie Space-t akkor hozhat létre, ha rendelkezik a következőkkel:

  • A Databricks SQL-jogosultsága.
  • Legalább CAN USE jogosultsági szinttel kell rendelkeznie egy profi vagy serverless SQL-tárházon.
  • Legalább SELECT jogosultságok egy vagy több Unity Catalog-adatobjektumon.

Lásd: Genie-tér beállítása és kezelése.

Társított Genie Spaces az AI/BI-irányítópultokhoz (nyilvános előzetes)

Természetes nyelvi kérésekkel vizualizációkat hozhat létre az AI/BI-irányítópultokhoz a Genie Code használatával. Tekintse meg a Genie Code használata irányítópult-létrehozáshoz című témakört.

Irányítópult létrehozásakor a Databricks automatikusan létrehoz egy társ Genie Space-t, amely lehetővé teszi, hogy az üzleti felhasználók természetes nyelven végezhessenek önkiszolgáló adatelemzést. Tekintse meg a Genie Spaces és az irányítópultok című témakört.

Dzsinn-térrel való interakció

Az üzleti csapatok a Genie Space végfelhasználói. A Genie Space használatához az üzleti felhasználóknak a következővel kell rendelkezniük:

  • A fogyasztói hozzáférés vagy a Databricks SQL-jogosultság.
  • A térben használt összes Unity Catalog-adatobjektumon legalább SELECT jogosultságok. A felhasználók csak azokat az adatokat látják, amelyekhez hozzáférésük van.

A lekérdezések a raktárat konfiguráló szerző által beágyazott számítási hitelesítő adatokkal futnak. A végfelhasználóknak nincs szükségük közvetlen raktárengedélyre.

Az üzleti felhasználók a tér kialakításában segíthetnek úgy, hogy tesztelik és visszajelzést adnak a fejlesztés során. Ha többet szeretne megtudni arról, hogyan kezdhetik meg az üzleti felhasználók a Genie Space használatát, olvassa el a Genie Space használata az üzleti adatok feltárásához dokumentációt.

Megbízható eszközök

A megbízható eszközök további biztosítéki réteget nyújtanak az eredmény pontosságában egy helyfelhasználó számára. Ha egy paraméteres példa lekérdezés vagy SQL-függvény pontos szövegét használja a válasz létrehozásához, a Genie megbízhatóként jelöli meg a választ. A megbízható objektumokról és a paraméteres lekérdezések használatával kapcsolatos további információkért tekintse meg a Megbízható eszközök című témakört.

Válaszok kiértékelése teljesítménymutatókkal

A teljesítménymutatók lehetővé teszik az egyes válaszok tesztelésének és kiértékelésének vertikális felskálázását egy Genie-térben. Az utasításoktól eltérően a teljesítménytesztek a Genie Space kiértékelésére, nem pedig tájékoztatására szolgálnak. Genie nem használ teljesítményteszt-kérdéseket vagy példa SQL-t a Genie környezetének javítására.

A teljesítménytesztek használatával tesztkérdések gyűjteményét futtathatja, és a válaszok segítségével mérheti Genie pontosságát. Opcionálisan megadhat egy SQL-utasítást, amely a várt eredményeket adja vissza. A teljesítményteszt-kérdés futtatásakor a Genie válaszát összehasonlítjuk az SQL-utasítás által megadott eredményekkel, és a pontosság szempontjából pontozza. A kérdés felülvizsgálatra van megjelölve, ha nem adott meg SQL-választ.

Lásd: Teljesítménymutatók használata Genie-térben.

Az adathozzáférés működése

A Genie-térben való adathozzáférést a Unity Katalógus szabályozza. Amikor egy felhasználó kérdést tesz fel, a létrehozott SQL-lekérdezés az adatokon fut a hely szerzője (a konfigurált SQL Warehouse) által beágyazott számítási hitelesítő adatokkal. A rendszer minden felhasználó saját Unity Catalog-adatengedélyeit alkalmazza a lekérdezési eredményekre. A felhasználók csak a hozzáférésre jogosult adatokat látják. A nem elérhető adatokkal kapcsolatos kérdések üres választ adnak vissza.

Ez a következőt jelenti:

  • Nem kell közvetlen raktárengedélyeket adnia a felhasználóknak.
  • A Unity Catalogban definiált sorszűrők és oszlopmaszkok felhasználónként automatikusan érvénybe lépnek.
  • Felhasználónkénti adatszűrés implementálásához alkalmazza a sorszintű biztonságot a Unity Catalog mögöttes tábláira. Lásd: Sorszűrők és oszlopmaszkok.

A Genie-tér felhasználói engedélyeinek beállításáról további információt a Genie-tér megosztása című témakörben talál.

Adatvédelem és biztonság

A Genie-térbeli adathozzáférést a Unity Katalógus szabályozza, beleértve a táblákra alkalmazott sorszűrőket és oszlopmaszkokat is. Lásd : Adathozzáférés-vezérlés , sorszűrők és oszlopmaszkok.

További adatvédelmi és biztonsági gyakori kérdésekért tekintse meg az AI-kisegítő funkciók adatvédelmi és biztonsági gyakori kérdéseket.

További erőforrások