Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Auf dieser Seite wird AI/BI Genie vorgestellt, ein Azure Databricks-Feature, mit dem Geschäftsteams mit ihren Daten mit natürlicher Sprache interagieren können. Es verwendet generative KI, die auf die Terminologie und Daten Ihrer Organisation zugeschnitten ist, mit der Möglichkeit, die Leistung durch Benutzerfeedback zu überwachen und zu verfeinern.
Übersicht
Domänenfachleute wie Datenanalystinnen und -analysten konfigurieren Genie Spaces mit Datasets, Beispielabfragen und Textrichtlinien, um Genie bei der Übersetzung von Geschäftsfragen in analytische Abfragen zu helfen. Nach der Einrichtung können Geschäftsbenutzerinnen und -benutzer Fragen stellen und Visualisierungen generieren, um betriebstechnische Daten zu verstehen. Sie können das semantische Wissen von Genie kontinuierlich aktualisieren, wenn sich Ihre Daten ändern und Benutzer neue Fragen stellen. Weitere Informationen zu Databricks AI-basierten Features finden Sie unter Databricks AI-gestützte Features.
AI/BI Genie wählt relevante Namen und Beschreibungen aus kommentierten Tabellen und Spalten aus, um Fragen in natürlicher Sprache in eine entsprechende SQL-Abfrage zu konvertieren. Anschließend antwortet es nach Möglichkeit mit der generierten Abfrage- und Ergebnistabelle. Wenn Genie keine Antwort generieren kann, kann er Nachverfolgungsfragen stellen, um zu klären, bevor er eine Antwort vorgibt.
Beispiele für Anwendungsfälle
Sie können verschiedene Genie Spaces für verschiedene nicht technische Zielgruppen erstellen. In den folgenden Szenarien werden zwei mögliche Anwendungsfälle beschrieben.
Beispiel 1: Visualisieren des Verkaufschancenstatus
Eine Vertriebsleiterin möchte den aktuellen Status von offenen und geschlossenen Verkaufschancen nach Stufen in ihrer Vertriebspipeline erhalten. Sie können mit dem Genie Space mit natürlicher Sprache interagieren und automatisch eine Visualisierung generieren.
Die folgende GIF zeigt diese Interaktion:
Beispiel 2: Nachverfolgen der Logistik
Ein Logistikunternehmen möchte Genie Spaces nutzen, um Geschäftskundinnen und -kunden aus verschiedenen Abteilungen dabei zu helfen, operative und finanzielle Details nachzuverfolgen. Es wurde ein Genie Space eingerichtet, in dem die Leiterinnen und Leiter der Versandabteilung die Sendungen verfolgen können, und ein weiterer Bereich, in dem die Finanzverantwortlichen die finanzielle Situation des Unternehmens nachvollziehen können.
Welche Daten sollte ich verwenden?
Ein Genie-Raum basiert auf Daten, die im Unity-Katalog registriert sind, einschließlich verwalteter Tabellen, externer Tabellen, Fremdtabellen, Ansichten, Metrikansichten und materialisierten Ansichten. AI/BI Genie verwendet die Metadaten, die an Unity Catalog-Objekte angefügt sind, sowie einen vom Autor kuratierten Wissensspeicher auf Raumebene, um Antworten zu generieren. Gut kommentierte Datasets, gepaart mit spezifischen Anweisungen, die Sie bereitstellen, sind entscheidend für die Erstellung einer positiven Erfahrung für Endbenutzerinnen und Endbenutzer.
Dateiuploads
Von großer Bedeutung
Dieses Feature befindet sich in der Public Preview.
Mit Dateiuploads können Benutzer ihre lokalen CSV- und Excel-Dateien mit Unity-Katalogdaten kombinieren, um Fragen zu beantworten. Um Dateiuploads zu aktivieren, wenden Sie sich an Ihr Databricks-Kontoteam. Weitere Informationen finden Sie unter Hochladen einer Datei.
Wie Genie funktioniert
Genie verwendet ein zusammengesetztes KI-System, um Geschäftsfragen zu interpretieren und Antworten zu generieren. Anstatt ein einzelnes großes Sprachmodell zu verwenden, verarbeiten zusammengesetzte KI-Systeme Aufgaben in KI-Anwendungen, indem mehrere interagierende Komponenten kombiniert werden. Zusammengesetzte KI-Systeme sind aufgrund ihrer Leistung und Flexibilität ein zunehmend gängiges Entwurfsmuster für KI-Anwendungen. Weitere Informationen finden Sie unter The Shift from Models to Compound AI Systems.
Was ist die Wissensdatenbank von Genie?
Genie-Autoren können unternehmens- und raumspezifische Metadaten direkt zu Datenressourcen in einem Genie-Raum hinzufügen. Dazu gehören Tabellen- und Spaltenmetadatenbeschreibungen, Synonyme auf Spaltenebene, stichprobenierte Werte und Wertwörterbücher, die Genie beim Generieren von Antworten konsultiert. Eine detaillierte Metadatenebene hilft Genie dabei, die richtigen Informationen abzurufen und genauere Ergebnisse zu erzielen.
Wie generiert Genie eine Antwort?
Wenn ein Benutzer eine Frage einreicht, analysiert Genie die Anfrage, identifiziert relevante Datenquellen und bestimmt, wie er auf die Aufforderung reagiert. Details, die Autoren in Kombination mit Unity-Katalogmetadaten bereitstellen, ermöglichen Es Genie, sowohl geschäfts- als auch technische Logik abzuleiten. Genie filtert intelligente SQL-Abfragen, Tabellen- und Spaltenmetadaten und chatverlauf, um die relevantesten Informationen zur Beantwortung der Anfrage auszuwählen.
Genie verwendet die folgenden Komponenten, um Antworten zu generieren:
- Metadaten der Unity-Katalogtabelle: Enthält Tabellennamen, Beschreibungen und definierte Beziehungen zwischen Primärschlüsseln (PK) und Fremdschlüsseln (FK). Genie verwendet diese Daten, da sie die Anforderung analysiert und die Aufforderung für natürliche Sprache in SQL konvertiert.
- Spaltennamen und Beschreibungen: Genie filtert intelligent nach relevanten Spaltennamen und Beschreibungen, die einbezogen werden sollen.
- Wissensspeicherkontext: Autoren können Tabellenmetadaten für Objekte lokal bearbeiten, die in einem Genie-Raum verwendet werden. Dies hilft Genie dabei, präzisere Antworten zu generieren und vorhandene Unity-Katalogmetadaten nicht zu ändern. Siehe Einrichten und Verwalten eines AI/BI Genie-Raums.
- Beispiel-SQL-Abfragen: Genie wählt relevante SQL-Beispiele aus SQL-Abfragen intelligent aus.
- SQL-Funktionen: Alle SQL-Funktionen, die im Bereich hinzugefügt wurden.
- Anweisungen: Die als Allgemeine Anweisungen bereitgestellten Nur-Text-Notizen sind als Kontext enthalten.
- Verlauf von Eingabeaufforderungen und Antworten: Eingabeaufforderungen und Antworten aus dem aktuellen Chat werden als Kontext einbezogen. Bei Bedarf werden aufgrund der festgelegten Tokenlimitsdie ältesten Teile des Chatprotokolls ausgeschlossen.
Hinweis
Einige Tabellendetails, z. B. der Besitzer und die Tabellengröße, sind standardmäßig nicht enthalten. Um auf diese Informationen zuzugreifen, verwenden Sie Ansichten aus dem Informationsschema, das für alle Unity-Kataloge verfügbar ist. Standardansichten könnten unnötige Details enthalten, daher kann das Erstellen einer benutzerdefinierten Ansicht darauf helfen, sich auf die benötigten spezifischen Informationen zu konzentrieren. Weitere Informationen dazu, was im Informationsschema verfügbar ist, finden Sie unter "Informationsschema".
In vielen Fällen generiert Genie eine SQL-Abfrage, die im SQL-Warehouse des Raums ausgeführt wird. Generierte Abfragen sind immer schreibgeschützt. Wiederholungen werden automatisch verarbeitet, und das SQL-Lager übernimmt Parallelität und Skalierung. Der Ergebnisdatensatz wird als Teil der Antwort angezeigt.
Einrichten eines Genie-Raums
Sie können einen Genie-Raum erstellen, wenn Sie:
- Die SQL-Berechtigung "Databricks".
- Mindestens die Berechtigung DARF VERWENDEN für ein Pro- oder Serverless-SQL-Warehouse.
- Mindestens Berechtigungen vom Typ
SELECT
für ein oder mehrere Unity Catalog-Datenobjekte.
Siehe Einrichten und Verwalten eines AI/BI Genie-Raums.
Interagieren mit einem Genie-Raum
Geschäftsteams sind die Endbenutzer für einen Genie Space. Um einen Genie-Raum zu verwenden, müssen Geschäftsbenutzer folgendes haben:
- Der Endbenutzerzugriff oder die Databricks SQL-Berechtigung.
- Mindestens die Berechtigung DARF VERWENDEN für das standardmäßige Warehouse, das für den Genie-Space vorgesehen ist.
- Mindestens
SELECT
-Berechtigungen für alle im Space verwendeten Unity Catalog-Datenobjekte.
Geschäftsbenutzer können beim Zusammenstellen eines Raums helfen, indem sie ihn testen und Während der Entwicklung Feedback geben. Weitere Informationen dazu, wie Geschäftsbenutzer mit einem Genie-Raum arbeiten können, finden Sie unter "Verwenden eines Genie-Raums", um Geschäftsdaten zu erkunden.
Vertrauenswürdige Ressourcen
Vertrauenswürdige Ressourcen vermitteln eine zusätzliche Zuverlässigkeitsebene in der Genauigkeit eines Ergebnisses für eine*n Raumbenutzer*in. Wenn der genaue Text einer parametrisierten Beispielabfrage oder SQL-Funktion verwendet wird, um eine Antwort zu generieren, markiert Genie die Antwort als vertrauenswürdig. Weitere Informationen zu vertrauenswürdigen Ressourcen finden Sie unter Verwenden von vertrauenswürdigen Ressourcen in AI/BI Genie Spaces . Weitere Informationen zur Arbeit mit parametrisierten Abfragen finden Sie in Verwenden von Parametern in SQL-Abfragen.
Antworten mit Benchmarks bewerten
Benchmarks ermöglichen es Ihnen, Tests und Bewertungen einzelner Antworten in einem Genie-Raum zu skalieren. Im Gegensatz zu Anweisungen sollen Referenzwerte Ihren Genie-Bereich bewerten, nicht informieren. Genie verwendet keine Benchmarkfragen oder Beispiel-SQL, um den Kontext von Genie zu verbessern.
Mithilfe von Benchmarks können Sie eine Sammlung von Testfragen ausführen und die Antworten verwenden, um die Genauigkeit von Genie zu messen. Optional können Sie eine SQL-Anweisung einfügen, die die erwarteten Ergebnisse zurückgibt. Wenn die Benchmark-Frage ausgeführt wird, wird die Antwort von Genie mit den Ergebnissen der SQL-Anweisung verglichen und für die Genauigkeit bewertet. Die Frage wird zur Überprüfung markiert, wenn keine SQL-Antwort bereitgestellt wurde.
Siehe Verwenden von Benchmarks in einem Genie-Raum.
Datenschutz und Sicherheit
F: Welches Modell verwendet Genie?
Genie ist ein Databricks AI-gestütztes Feature. Es verwendet ein zusammengesetztes KI-System, das die Verwendung von KI-Modellen, Abruf-, Bewertungs- und Personalisierungssystemen kombiniert, um die Daten und Nutzungsmuster Ihrer Organisation zu verstehen. Weitere Informationen finden Sie unter Databricks KI-gestützte Features.
F: Welche Daten werden an das Modell gesendet?
Genie verwendet Ihre Eingabeaufforderung, relevante Tabellenmetadaten und -werte, Fehler sowie Eingabecode oder Abfragen beim Generieren einer Antwort.
Um Antworten zu verarbeiten, verwendet Genie Folgendes:
- Die vom Benutzer übermittelte Aufforderung in natürlicher Sprache
- Tabellennamen und -beschreibungen
- Spaltentitel, Beschreibungen und Beispielwerte
- Allgemeine Anleitungen
- SQL-Beispielabfragen
- SQL-Funktionen
F: Speichert Azure OpenAI meine Daten?
Nein Wenn Sie Azure OpenAI-Modelle über Databricks verwenden, speichert Microsoft keine Eingabeaufforderungen oder Antworten für einen bestimmten Zeitraum auf jeder Ebene, nicht einmal in Netzwerkprotokollen. Dazu gehören Daten, die normalerweise zur Missbrauchsüberwachung verwendet werden. Databricks hat die Missbrauchsüberwachung und die menschliche Überprüfung von Azure OpenAI deaktiviert, sodass Microsoft keine daten speichert oder prüft, die von Genie gesendet wurden. Weitere Informationen finden Sie in der Dokumentation von Microsoft.
F: Wo werden Genie-Antworten gespeichert?
Genie-Antworten werden in der Azure Databricks-Steuerebene gespeichert.
F: Wird die Filterung auf Zeilenebene in einem Genie-Raum unterstützt?
Ja, Berechtigungen, die im Unity-Katalog gewährt werden, steuern, welche Benutzer auf bestimmte Datenobjekte zugreifen können. Wenn Zeilenfilter oder Spaltenmasken auf ein Datenobjekt angewendet werden, steuern sie, welche Werte in der Ergebnismenge zurückgegeben werden. Siehe Zeilenfilter und Spaltenmasken.
F: Wie wird mein Datenverkehr über Geos weitergeleitet?
Genie wird in den USA, eu, AUS und Indien eingesetzt.
Das Datenverkehrsrouting hängt von Ihrer Region ab und ob die geoübergreifende Verarbeitung aktiviert ist (Erzwingen der Datenverarbeitung innerhalb des Arbeitsbereichs "Geografie für bestimmte Dienste" ist deaktiviert):
- EU: Der Verkehr verläuft immer über die EU, unabhängig von der geoübergreifenden Verarbeitung.
- USA: Datenverkehr leitet immer durch die USA, unabhängig von der geoübergreifenden Verarbeitung.
- Indien und AUS:
- Wenn die geoübergreifende Verarbeitung deaktiviert ist: Der Datenverkehr bleibt garantiert innerhalb Ihrer Region.
- Wenn die cross-Geo-Verarbeitung aktiviert ist, wird der Datenverkehr immer durch die USA geleitet.
- Alle anderen Regionen:
- Wenn die geoübergreifende Verarbeitung deaktiviert ist: Genie funktioniert nicht.
- Wenn die cross-Geo-Verarbeitung aktiviert ist, wird der Datenverkehr durch die USA geleitet.