Häufig gestellte Fragen zu Azure Databricks
In diesem Artikel sind die wichtigsten Fragen im Zusammenhang mit Azure Databricks aufgeführt. Außerdem werden einige häufige Probleme aufgelistet, die bei der Verwendung von Databricks auftreten können. Weitere Informationen finden Sie unter Was ist Azure Databricks?.
Ja. Sie können Azure Key Vault verwenden, um Schlüssel/Geheimnisse für den Einsatz in Azure Databricks speichern. Weitere Informationen finden Sie bei den von Azure Key Vault unterstützten Bereichen.
Ja. Sie können ein virtuelles Azure-Netzwerk (VNET) mit Azure Databricks verwenden. Weitere Informationen finden Sie unter Bereitstellen von Azure Databricks in Ihrem virtuellen Azure-Netzwerk.
Führen Sie folgende Schritte aus:
- Stellen Sie in Microsoft Entra ID (früher Azure Active Directory) einen Dienstprinzipal bereit, und erfassen Sie dessen Schlüssel.
- Weisen Sie dem Dienstprinzipal in Data Lake Storage die erforderlichen Berechtigungen zu.
- Verwenden Sie zum Zugreifen auf eine Datei in Data Lake Storage die Anmeldeinformationen für den Dienstprinzipal in Notebook.
Weitere Informationen finden Sie unter Verwenden von Azure Data Lake Storage mit Azure Databricks.
Hier folgen einige Probleme, die mit Databricks auftreten können.
Problem: Dieses Abonnement ist nicht für die Verwendung des Namespace „Microsoft.Databricks“ registriert.
„Dieses Abonnement ist nicht für die Verwendung des Namespace „Microsoft.Databricks“ registriert. Informationen zum Registrieren von Abonnements finden Sie unter https://aka.ms/rps-not-found. (Code: MissingSubscriptionRegistration)“
- Öffnen Sie das Azure-Portal.
- Wählen Sie Abonnements und das von Ihnen verwendete Abonnement aus. Wählen Sie anschließend Ressourcenanbieter aus.
- Wählen Sie in der Liste der Ressourcenanbieter für Microsoft.Databricks die Option Registrieren aus. Sie müssen über die Rolle „Mitwirkender“ oder „Besitzer“ für das Abonnement verfügen, um den Ressourcenanbieter zu registrieren.
Problem: Ihr Konto {E-Mail} weist nicht die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource im Azure-Portal auf.
„Ihr Konto {E-Mail} weist nicht die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource im Azure-Portal auf. Dieser Fehler kann auch auftreten, wenn Sie ein Gastbenutzer im Mandanten sind. Bitten Sie Ihren Administrator, Ihnen den Zugriff zu gewähren oder Sie als einen Benutzer direkt im Databricks-Arbeitsbereich hinzuzufügen.“ (Code: AADSTS90015)
Nachfolgend sind einige Lösungen für dieses Problem aufgeführt:
Wenn Sie ein Azure Databricks-Benutzer ohne die Rolle „Besitzer“ oder „Mitwirkender“ für die Databricks-Arbeitsbereichsressource sind und einfach nur auf den Arbeitsbereich zugreifen möchten:
- Greifen Sie direkt über die URL (beispielsweise
https://adb-5555555555555555.19.azuredatabricks.net
) darauf zu. Verwenden Sie nicht die Schaltfläche „Arbeitsbereich starten“ im Azure-Portal.
Wenn Sie erwartet haben, dass Sie als Besitzer oder Mitwirkender für die Arbeitsbereichsressource erkannt werden:
Um den Mandanten zu initialisieren, müssen Sie als ein regulärer Benutzer des Mandanten und nicht als Gastbenutzer angemeldet sein. Außerdem müssen Sie über die Rolle „Mitwirkender“ oder „Besitzer“ für die Databricks-Arbeitsbereichsressource verfügen. Ein Administrator kann einem Benutzer im Azure-Portal über die Registerkarte Zugriffssteuerung (IAM) des Azure Databricks-Arbeitsbereichs eine Rolle zuweisen.
Dieser Fehler kann auch auftreten, wenn Ihr E-Mail-Domänenname mehreren Verzeichnissen in Microsoft Entra ID (ehemals Azure Active Directory) zugewiesen ist. Um dieses Problem zu umgehen, erstellen Sie einen neuen Benutzer in dem Verzeichnis, das das Abonnement mit Ihrem Databricks-Arbeitsbereich enthält.
a. Navigieren Sie im Azure-Portal zu Microsoft Entra ID. Wählen Sie Benutzer und Gruppen>Benutzer hinzufügen aus.
b. Fügen Sie einen Benutzer mit einer E-Mail-Adresse vom Typ
@<tenant-name>.onmicrosoft.com
anstelle einer E-Mail-Adresse vom Typ@<your-domain>
hinzu. Diese Option finden Sie unter Benutzerdefinierte Domänen unter „Microsoft Entra ID“ im Azure-Portal.c. Gewähren Sie diesem neuen Benutzer die Rolle Mitwirkender für die Databricks-Arbeitsbereichsressource.
d. Melden Sie sich beim Azure-Portal mit dem neuen Benutzer an, und suchen Sie den Databricks-Arbeitsbereich.
e. Starten Sie den Databricks-Arbeitsbereich als dieser Benutzer.
Wenn Sie den Arbeitsbereich nicht erstellt haben und als Benutzer hinzugefügt werden, wenden Sie sich an die Person, die den Arbeitsbereich erstellt hat. Lassen Sie sich von dieser Person hinzufügen, indem Sie die Azure Databricks Admin Console verwenden. Anweisungen hierzu finden Sie unter Hinzufügen und Verwalten von Benutzern. Wenn Sie den Arbeitsbereich erstellt haben und weiterhin diese Fehlermeldung erhalten, wählen Sie im Azure-Portal erneut Arbeitsbereich initialisieren aus.
Problem: Startfehler des Cloudanbieters beim Einrichten der Compute-Ressource (PublicIPCountLimitReached)
„Startfehler des Cloudanbieters: Beim Einrichten der Compute-Ressource ist ein Fehler des Cloudanbieters aufgetreten. Weitere Informationen finden Sie im Databricks-Handbuch. Azure-Fehlercode: PublicIPCountLimitReached. Azure-Fehlermeldung: Es können maximal 10 öffentliche IP-Adressen für dieses Abonnement in dieser Region erstellt werden.
Databricks-Compute-Ressourcen verwenden jeweils eine öffentliche IP-Adresse pro Knoten (einschließlich des Treiberknotens). Für Azure-Abonnements gelten regionsspezifische Grenzwerte für öffentliche IP-Adressen. Daher kann es vorkommen, dass Vorgänge für die Erstellung von Compute-Ressourcen oder für die zentrale Hochskalierung nicht erfolgreich sind, wenn sie dazu führen, dass die Anzahl öffentlicher IP-Adressen, die diesem Abonnement in dieser Region zugeordnet sind, den Grenzwert übersteigen. Dieser Grenzwert gilt auch für öffentliche IP-Adressen, die für eine Databricks-fremde Verwendung zugeordnet werden (etwa für benutzerdefinierte virtuelle Computer).
Generell werden öffentliche IP-Adressen nur von aktiven Compute-Ressourcen genutzt. Fehler vom Typ PublicIPCountLimitReached
können jedoch noch eine Zeitlang auftreten, auch wenn bereits andere Compute-Ressourcen beendet wurden. Das liegt daran, dass Azure-Ressourcen vorübergehend von Databricks zwischengespeichert werden, wenn eine Compute-Ressource beendet wird. Das Zwischenspeichern von Ressourcen ist beabsichtigt, da es die Wartezeit beim Compute-Start sowie bei der automatischen Skalierung in vielen Szenarien erheblich verkürzt.
Wenn bei Ihrem Abonnement in einer bestimmten Region bereits der Grenzwert für öffentliche IP-Adressen erreicht wurde, können Sie eine der folgenden Aktionen ausführen:
- Erstellen Sie neue Compute-Ressourcen in einem anderen Databricks-Arbeitsbereich. Der andere Arbeitsbereich muss sich in einer Region befinden, in der der Grenzwert für öffentliche IP-Adressen Ihres Abonnements noch nicht erreicht wurde.
- Fordern Sie eine Erhöhung Ihres Grenzwerts für öffentliche IP-Adressen an. Wählen Sie Kontingent als Problemtyp und Netzwerk: ARM als Kontingenttyp aus. Fordern Sie in Details eine Erhöhung des Kontingents für öffentliche IP-Adressen an. Wenn Ihr aktueller Grenzwert beispielsweise bei 60 liegt und eine Compute-Ressource mit 100 Knoten erstellt werden soll, fordern Sie eine Erhöhung auf 160 an.
Problem: Zweite Art von Startfehler des Cloudanbieters beim Einrichten des Compute (MissingSubscriptionRegistration)
„Startfehler des Cloudanbieters: Beim Einrichten der Compute-Ressource ist ein Fehler des Cloudanbieters aufgetreten. Weitere Informationen finden Sie im Databricks-Handbuch. Azure-Fehlercode: MissingSubscriptionRegistration Azure-Fehlermeldung: Das Abonnement ist nicht zur Verwendung von Namespace "Microsoft.Compute" registriert. Informationen zum Registrieren von Abonnements finden Sie unter https://aka.ms/rps-not-found.“
- Öffnen Sie das Azure-Portal.
- Wählen Sie Abonnements und das von Ihnen verwendete Abonnement aus. Wählen Sie anschließend Ressourcenanbieter aus.
- Wählen Sie in der Liste der Ressourcenanbieter für Microsoft.Compute die Option Registrieren aus. Sie müssen über die Rolle „Mitwirkender“ oder „Besitzer“ für das Abonnement verfügen, um den Ressourcenanbieter zu registrieren.
Ausführlichere Anweisungen finden Sie unter Ressourcenanbieter und -typen.
Problem: Azure Databricks benötigt Berechtigungen zum Zugreifen auf Ressourcen in Ihrer Organisation, die nur ein Administrator erteilen kann.
Azure Databricks ist in Microsoft Entra ID integriert. Legen Sie durch Angabe von Benutzern aus Microsoft Entra ID Berechtigungen innerhalb von Azure Databricks fest (z. B. für Notebooks oder Compute-Ressourcen). Um in Azure Databricks die Namen der Benutzer aus Microsoft Entra ID aufzulisten, sind eine Leseberechtigung für diese Informationen und eine Einwilligung erforderlich. Wenn noch keine Zustimmung vorliegt, wird die Fehlermeldung angezeigt.
Melden Sie sich als Administrator beim Azure-Portal an. Navigieren Sie in Microsoft Entra ID zur Registerkarte Einstellungen, und stellen Sie sicher, dass Benutzer können Apps den Zugriff auf Unternehmensdaten in ihrem Namen gestatten auf Ja festgelegt ist.
Problem: Azure Databricks unterstützt die Erstellung von Arbeitsbereichen nicht unter Azure-Ressourcengruppen, die mit chinesischen Zeichen erstellt werden.
Die Unterstützung für die Validierung dieses Szenarios als Teil der Arbeitsbereichserstellung wird in einer späteren Version hinzugefügt.