Freigeben über


Hinzufügen von KI-generierten Kommentaren zu Unity Catalog-Objekten

Dieser Artikel enthält eine Einführung in KI-generierte Kommentare für Unity Catalog-Objekte und -Tabellenspalten (auch als KI-generierte Dokumentation bezeichnet). Es wird darin erläutert, wie sie funktionieren und wie sie hinzugefügt und bearbeitet werden. Außerdem finden Sie hier Antworten auf häufig gestellte Fragen.

Unterstützte Objekte

KI-generierte Kommentare werden für die folgenden Unity Catalog-Objekte unterstützt:

  • Kataloge
  • Schemas
  • Tabellen
  • Tabellenspalten
  • Functions
  • Modelle
  • Volumes

Von KI generierte Kommentare unterstützen keine Ansichten oder materialisierten Ansichten.

Wie funktionieren KI-generierte Kommentare?

Als Objektbesitzer oder Benutzer mit der Berechtigung zum Ändern eines Objekts können Sie über den Katalog-Explorer einen KI-generierten Kommentar für Objekte und Tabellenspalten, die von Unity Catalog verwaltet werden, anzeigen und hinzufügen. Kommentare werden durch ein großes Sprachmodell (Large Language Model, LLM) unterstützt, das die Objektmetadaten berücksichtigt, z. B. das Tabellenschema und die Spaltennamen.

KI-generierte Kommentare bieten eine schnelle Möglichkeit, Benutzer bei der Ermittlung von Daten zu unterstützen, die von Unity Catalog verwaltet werden.

Wichtig

KI-generierte Kommentare sollen eine allgemeine Beschreibung von Objekten und Tabellenspalten basierend auf dem Schema bieten. Die Beschreibungen wurden für Daten in einem Geschäfts- und Unternehmenskontext mithilfe von Beispielschemas aus mehreren offenen Datasets in einer Vielzahl von Branchen optimiert. Das Modell wurde mit Hunderten simulierter Proben ausgewertet, um zu überprüfen, ob schädliche oder unangemessene Beschreibungen generiert werden.

KI-Modelle sind nicht immer genau, und Kommentare müssen vor dem Speichern überprüft werden. Databricks empfiehlt dringend eine menschliche Überprüfung von KI-generierten Kommentaren, um Ungenauigkeiten zu erkennen. Das Modell sollte nicht für Datenklassifizierungsaufgaben wie das Erkennen von Spalten mit personenbezogenen Informationen verwendet werden.

Wenn Sie hinzugefügte Kommentare anzeigen möchten, benötigen Sie das Recht SELECT für das Objekt, USE SCHEMA für das übergeordnete Schema und USE CATALOG für den übergeordneten Katalog.

Informationen zu den Modellen, mit deren Hilfe Kommentarvorschlägen generiert werden, finden Sie unter Häufig gestellte Fragen zu KI-generierten Kommentaren.

Voraussetzungen

Damit Sie KI-generierte Kommentare verwenden können, muss ein Arbeitsbereichsadministrator zunächst Azure KI Services-gestützte Hilfsfunktionen aktivieren:

  1. Wechseln Sie unter Einstellungen zur Registerkarte Erweitert, und scrollen Sie nach unten zum Abschnitt Andere.
  2. Aktivieren Sie die Option Azure KI Services-gestützte KI-Hilfsfunktionen.

Hinzufügen KI-generierter Kommentare

Sie müssen den Katalog-Explorer verwenden, um vorgeschlagene Kommentare anzuzeigen, sie zu bearbeiten und sie Objekten und Tabellenspalten hinzuzufügen.

Erforderliche Berechtigungen: Sie müssen der Objektbesitzer sein oder über die Berechtigungen MODIFY für das Objekt verfügen, um den von der KI vorgeschlagenen Kommentar anzuzeigen, ihn zu bearbeiten und hinzuzufügen.

Hinzufügen eines von der KI vorgeschlagenen Kommentars zu einem Objekt

  1. Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Symbol „Katalog“ Katalog.

  2. Suchen Sie nach dem Objekt, und wählen Sie es aus.

  3. Klicken Sie im Bereich Info zu diesem <object> auf Mit KI generieren.

    Schaltfläche für KI-generierte Kommentare

    Die KI kann einen Moment benötigen, um den Kommentar zu generieren.

  4. Klicken Sie auf Annehmen, um den Kommentar wie ausgegeben zu akzeptieren, oder auf Bearbeiten, um ihn zu ändern, bevor Sie ihn speichern.

Hinzufügen eines von der KI vorgeschlagenen Kommentars zu einer Tabellenspalte

  1. Klicken Sie in Ihrem Azure Databricks-Arbeitsbereich auf Symbol „Katalog“ Katalog.

  2. Suchen Sie nach der Tabelle, und wählen Sie sie aus.

  3. Klicken Sie oberhalb der Überschriften der Tabellenspalten auf Mit KI generieren.

    Für jede Spalte wird ein Kommentar generiert.

  4. Klicken Sie auf das Häkchen neben dem Spaltenkommentar, um ihn zu akzeptieren oder nicht gespeichert zu schließen.

Aktualisieren eines KI-generierten Kommentars

Der Objektbesitzer oder ein Benutzer mit dem Recht MODIFY für das Objekt kann Kommentare jederzeit über die Benutzeroberfläche des Katalog-Explorers aktualisieren. Der Inline-Chat-Assistent hilft beim Bearbeiten von Kommentaren und bietet Optionen zum Kürzen von Text oder zum Übersetzen von Text in eine andere Sprache.

Inline-Assistent für KI-generierte Kommentare

Sie können außerdem ALTER nutzen oder SQL-Befehle per COMMENT ON kommentieren.

Häufig gestellte Fragen zu KI-generierten Kommentaren

Dieser Abschnitt enthält allgemeine Informationen zu KI-generierten Kommentaren (auch als KI-generierte Dokumentation bezeichnet) in Form häufig gestellter Fragen.

Welche Dienste werden vom Feature für KI-generierte Dokumentation verwendet?

KI-generierte Kommentare nutzen ein internes großes Sprachmodell (Large Language Model, LLM) für Tabellen und Spalten. Für andere Unity Catalog-Objekte und den Inline-Assistenten wird unter Umständen auf externe Modellpartner zurückgegriffen. An externe Dienste gesendete Daten werden nicht für das Modelltraining verwendet. Die Modelle selbst sind zustandslos: Keine Eingabeaufforderungen oder Eingaben werden von Modellanbietern gespeichert.

In welchen Regionen werden Modellbereitstellungsendpunkte gehostet?

Für Arbeitsbereiche der Europäischen Union (EU) verwenden KI-Hilfsfunktionen ein externes Modell, das in der EU gehostet wird. Alle anderen Regionen verwenden ein Modell, das in den USA gehostet wird.

Wie werden Daten zwischen Azure Databricks und Azure KI Services verschlüsselt?

Der Datenverkehr zwischen Databricks und Azure KI Services wird während der Übertragung mithilfe der branchenüblichen TLS 1.2-Verschlüsselung verschlüsselt.

Wird alles im Ruhezustand verschlüsselt?

Alle Daten, die in einem Azure Databricks-Arbeitsbereich gespeichert sind, werden mit der AES-256-Bit-Verschlüsselung verschlüsselt. Unsere externen Partner speichern keine Eingabeaufforderungen oder Eingaben, die an sie gesendet werden.

Welche Daten werden an die Modelle gesendet?

Azure Databricks sendet bei jeder API-Anforderung die folgenden Metadaten an die Modelle:

  • Katalog (Katalogname, aktueller Kommentar, Katalogtyp)
  • Schema (Katalogname, Schemaname, aktueller Kommentar)
  • Tabelle (Katalogname, Schemaname, Tabellenname, aktueller Kommentar)
  • Funktion (Katalogname, Schemaname, Funktionsname, aktueller Kommentar, Parameter, Definition)
  • Modell (Katalogname, Schemaname, Modellname, aktueller Kommentar, Aliasse)
  • Volume (Katalogname, Schemaname, Volumename, aktueller Kommentar)
  • Spaltennamen (Spaltenname, Typ, Primärschlüssel ja oder nein, aktueller Spaltenkommentar)

Genehmigte Kommentare werden zusammen mit den restlichen Unity Catalog-Metadaten in der Azure Databricks-Datenbank der Steuerungsebene gespeichert. Die Datenbank der Steuerungsebene wird mit der AES-256-Bit-Verschlüsselung verschlüsselt.

Die Nutzung unterliegt den bestehenden Azure Databricks-Geschäftsbedingungen, denen bei Verwendung von Azure Databricks zugestimmt wurde.