Teilen über


Databricks KI-Hilfsfunktionen Vertrauen und Sicherheit

Databricks versteht die Bedeutung Ihrer Daten und das Vertrauen, das Sie bei der Verwendung unserer Plattform und databricks AI-Hilfsfunktionen in uns platzieren. Databricks verpflichtet sich zu den höchsten Standards des Datenschutzes und hat strenge Maßnahmen implementiert, um sicherzustellen, dass Informationen, die Sie an Databricks KI-Hilfsfunktionen übermitteln, geschützt sind.

  • Ihre Daten bleiben vertraulich.
    • Databricks trainiert keine generativen Foundation-Modelle mit Daten, die Sie an diese Features übermitteln, und Databricks verwendet diese Daten nicht, um Vorschläge zu generieren, die für andere Kunden angezeigt werden.
    • Unsere Modellpartner speichern Ihre über diese Features übermittelten Daten nicht, auch nicht für die Missbrauchsüberwachung. Unsere partnergestützten KI-Hilfsfunktionen verwenden null Datenaufbewahrungsendpunkte von unseren Modellpartnern.
  • Schutz vor schädlichen Ausgaben. Bei Verwendung von Azure Open AI verwendet Databricks auch azure OpenAI-Inhaltsfilterung , um Benutzer vor schädlichen Inhalten zu schützen. Darüber hinaus hat Databricks eine umfangreiche Auswertung mit Tausenden simulierter Benutzerinteraktionen durchgeführt, um sicherzustellen, dass die Maßnahmen zum Schutz vor schädlichen Inhalten, Jailbreaks, der Generierung unsicherer Codes und der Verwendung urheberrechtlich geschützter Inhalte von Dritten wirksam sind.
  • Databricks verwendet nur die für die Bereitstellung des Dienstes erforderlichen Daten. Daten werden nur gesendet, wenn Sie mit Databricks AI-Hilfsfunktionen interagieren. Databricks sendet Ihre Eingabeaufforderung, relevante Tabellenmetadaten und -werte, Fehler sowie Eingabecode oder Abfragen, um relevantere Ergebnisse zurückzugeben.
  • Databricks trainiert keine generativen Foundation-Modelle mit Daten, Eingabeaufforderungen oder Antworten, die Sie an diese Features übermitteln. Databricks verwendet diese Daten nicht, um Vorschläge zu generieren, die für andere Kunden angezeigt werden.
  • Daten werden während der Übertragung und im Ruhezustand geschützt. Der gesamte Datenverkehr zwischen Databricks und Modellpartnern wird während der Übertragung mit branchenübter TLS-Verschlüsselung verschlüsselt. Alle Daten, die in einem Azure Databricks-Arbeitsbereich gespeichert sind, werden mit der AES-256-Bit-Verschlüsselung verschlüsselt.
  • Databricks bietet Datenresidenzsteuerelemente. Databricks AI-Hilfsfunktionen sind vorgesehene Dienste und entsprechen den Datenresidenz-Grenzen. Weitere Details finden Sie unter Databricks Geos: Datenresidenz und Databricks Designated Services.

Informationen zum Datenschutz des Databricks Assistant finden Sie in den häufig gestellten Fragen zu Datenschutz und Sicherheit.

Häufig gestellte Fragen zu Datenschutz und Sicherheit

Welche Dienste und Modelle verwenden partnergestützte KI-Hilfsfunktionen?

Wenn die Einstellung der partnergestützten KI-Features aktiviert ist, verwenden Databricks KI-Hilfsfeatures Modelle, die vom Azure OpenAI-Dienst oder Anthropic auf Databricks gehostet werden. Wenn Sie die Einstellung für partnergestützte KI-Features deaktivieren, verwenden einige KI-Hilfsfeatures möglicherweise ein in Databricks gehostetes Modell. Weitere Informationen finden Sie unter partnergestützte KI-Features.

Welche Daten werden an die Modelle gesendet?

Databricks sendet nur die Daten, die für die Bereitstellung des Dienstes erforderlich sind, was für jedes Feature unterschiedlich sein kann.

Der Databricks-Assistent sendet Ihre Eingabeaufforderung (z. B. Ihre Frage oder Ihren Code) sowie relevante Metadaten an das Modell, das das Feature für jede API-Anforderung unterstützt. Dies trägt dazu bei, relevantere Ergebnisse für Ihre Daten zurückzugeben. Beispiele sind:

  • Code und Abfragen in der aktuellen Notebookzelle oder auf der Registerkarte im SQL-Editor
  • Tabellen- und Spaltennamen und -beschreibungen
  • Vorherige Fragen
  • Bevorzugte Tabellen

Der Assistent-Agent-Modus, jetzt in Beta, kann auch Zellausgaben analysieren und Datenbeispiele aus Tabellen lesen, ähnlich wie andere Codierungs-Agents in der Branche.

Genie verwendet Ihre Eingabeaufforderung, relevante Tabellenmetadaten und -werte, Fehler sowie Eingabecode oder Abfragen beim Generieren einer Antwort.

Um Antworten zu verarbeiten, verwendet Genie Folgendes:

  • Die vom Benutzer übermittelte Aufforderung in natürlicher Sprache
  • Tabellennamen und -beschreibungen
  • Relevante Werte
  • Allgemeine Anleitungen
  • SQL-Beispielabfragen
  • SQL-Funktionen

Für KI-generierte Kommentare sendet Databricks die folgenden Metadaten an die Modelle mit jeder API-Anforderung:

  • Katalog (Katalogname, aktueller Kommentar, Katalogtyp)
  • Schema (Katalogname, Schemaname, aktueller Kommentar)
  • Tabelle (Katalogname, Schemaname, Tabellenname, aktueller Kommentar)
  • Funktion (Katalogname, Schemaname, Funktionsname, aktueller Kommentar, Parameter, Definition)
  • Modell (Katalogname, Schemaname, Modellname, aktueller Kommentar, Aliase)
  • Volume (Katalogname, Schemaname, Volumename, aktueller Kommentar)
  • Spaltennamen (Spaltenname, Typ, Primärschlüssel oder nicht, aktueller Spaltenkommentar)

Speichern Partnermodellanbieter meine Daten?

Nein. Wenn Sie Partnermodelle über Databricks verwenden, speichern Partnermodellanbieter keine Eingabeaufforderungen oder Antworten.

Wo werden Antworten von KI-Hilfsfeatures gespeichert?

Genie-Antworten und genehmigte KI-generierte Kommentare werden in der Datenbank der Databricks-Steuerungsebene gespeichert. Die Datenbank der Steuerebene ist AES-256-Bit verschlüsselt.

Der Chatverlauf des Assistenten wird an derselben Stelle wie andere Notizbuchinhalte gespeichert.

Berücksichtigt die an die Modelle gesendeten Daten die Unity-Katalogberechtigungen des Benutzers?

Ja, alle Daten, die an KI-Hilfsfeaturemodelle gesendet werden, respektieren die Berechtigungen des Unity-Katalogs, sodass keine Daten, auf die Benutzer keinen Zugriff haben, an solche Modelle gesendet werden.

Können andere Benutzer meinen Chatverlauf mit dem Assistenten oder Genie sehen?

Interaktionen mit dem Assistenten sind nur für den Benutzer sichtbar, der sie initiiert hat.

Genie Space Manager können die Nachrichten anderer Benutzer sehen, aber nicht ihre Abfrageergebnisse.

Führen Genie oder Databricks Assistant Code aus?

Genie ist mit schreibgeschütztem Zugriff auf Kundendaten konzipiert, sodass nur schreibgeschützte SQL-Abfragen generiert und ausgeführt werden können.

Mit dem Agentmodus kann der Assistent Code im Notizbuch- und SQL-Editor ausführen. Zunächst werden Sie vom Assistenten zur Bestätigung aufgefordert, mit der Ausführung fortzufahren. Sie können die Ausführung im aktuellen Assistententhread bestätigen, immer zulassen oder die Ausführung immer zulassen. Andere Assistentenmodi führen code nicht automatisch in Ihrem Auftrag aus.

KI-Modelle können Fehler machen, Absichten missverstehen, Antworten falsch interpretieren oder insgesamt falsche Antworten geben. Überprüfen und testen Sie AI-generierten Code, bevor Sie ihn ausführen.

Hat Databricks eine Bewertung durchgeführt, um die Genauigkeit und Angemessenheit der Antworten von KI-Hilfsfunktionen zu bewerten?

Ja, Databricks hat umfangreiche Tests aller unserer KI-Hilfsfunktionen basierend auf ihren erwarteten Anwendungsfällen durchgeführt und simulierte Benutzereingaben verwendet, um die Genauigkeit und Angemessenheit der Antworten zu erhöhen. Das heißt, generative KI ist eine neue Technologie, und KI-Hilfsfunktionen können ungenaue oder unangemessene Antworten liefern.

Kann ich KI-Hilfsfunktionen mit Tabellen verwenden, die regulierte Daten verarbeiten (PHI, PCI, IRAP, FedRAMP)?

Ja. Dazu müssen Sie Anforderungen erfüllen. Sie müssen zum Beispiel das Compliancesicherheitsprofil aktivieren und bei der Konfiguration des Compliancesicherheitsprofils den relevanten Compliancestandard hinzufügen.

Wie wird mein Datenverkehr über Geos weitergeleitet?

Databricks KI-Hilfsfunktionen sind bestimmte Dienste, die Databricks Geos verwenden, um die Datenhaltung beim Verarbeiten von Kundeninhalten zu verwalten. Das Datenverkehrsrouting hängt von Ihrer Region ab und davon, ob die geoübergreifende Verarbeitung aktiviert ist (die Datenverarbeitung innerhalb des Arbeitsbereichs "Geografie für bestimmte Dienste " ist deaktiviert).

Wie funktionieren KI-Hilfsfeatures mit von Databricks gehosteten Modellen?

Wenn Databricks KI-Hilfsfunktionen databricks-gehostete Modelle verwenden, verwenden sie OpenAI GPT OSS oder andere Modelle, die für die kommerzielle Nutzung verfügbar sind. Sehen Sie Informationen zur Lizenzierung und Verwendung von generativen KI-Modellen.

Das folgende Diagramm bietet eine Übersicht darüber, wie ein von Databricks gehostetes Modell Databricks KI-gestützte Features wie Quick Fix unterstützt.

Diagramm des Workflows für den Databricks-Assistenten, der von einem in Databricks gehosteten Modell unterstützt wird.

  1. Ein Benutzer führt eine Notizbuchzelle aus, was zu einem Fehler führt.
  2. Databricks fügt Metadaten an eine Anforderung an und sendet sie an ein vom Databricks gehostetes Großsprachenmodell (LLM). Alle Daten werden im Ruhezustand verschlüsselt. Kunden können einen vom Kunden verwalteten Schlüssel (CMK) verwenden.
  3. Das vom Databricks gehostete Modell antwortet mit den vorgeschlagenen Codebearbeitungen, um den Fehler zu beheben, der dem Benutzer angezeigt wird.