Verbinden mit Azure Data Explorer mithilfe von Apache Spark für Azure Synapse Analytics

Artikel
10/26/2023

In diesem Artikel wird beschrieben, wie Sie aus Synapse Studio mit Apache Spark für Azure Synapse Analytics auf eine Azure Data Explorer-Datenbank zugreifen.

Voraussetzungen

Erstellen eines Azure Data Explorer-Clusters und einer Datenbank
Vorhandensein eines Azure Synapse Analytics-Arbeitsbereichs, oder erstellen Sie einen neuen Arbeitsbereich anhand der Schritte in Schnellstart: Erstellen eines Azure Synapse-Arbeitsbereichs.
Vorhandensein eines Apache Spark-Pools, oder erstellen Sie einen neuen Pool anhand der Schritte in Schnellstart: Erstellen eines neuen Apache Spark-Pools (Vorschauversion).
Erstellen einer Microsoft Entra-App durch Bereitstellen einer Microsoft Entra-Anwendung.
Gewähren Sie Ihrer Microsoft Entra-App Zugriff auf Ihre Datenbank, indem Sie die Schritte in Verwalten der Berechtigungen für Datenbanken in Azure Data Explorer verwenden.

Wechseln zu Synapse Studio

Wählen Sie in einem Azure Synapse-Arbeitsbereich die Option Synapse Studio starten aus. Wählen Sie auf der Synapse Studio-Homepage die Option Daten aus, um zum Datenobjekt-Explorer zu gelangen.

Herstellen einer Verbindung zwischen einer Azure Data Explorer-Datenbank und einem Azure Synapse-Arbeitsbereich

Für die Verbindungsherstellung einer Azure Data Explorer-Datenbank mit einem Arbeitsbereich wird ein verknüpfter Dienst verwendet. Mit einem verknüpften Azure Data Explorer-Dienst können Sie über Apache Spark für Azure Synapse Daten durchsuchen und erkunden sowie lesen und schreiben. Sie können auch Integrationsaufträge in einer Pipeline ausführen.

Führen Sie im Datenobjekt-Explorer die folgenden Schritte aus, um eine direkte Verbindung mit einem Azure Data Explorer-Cluster herzustellen:

Wählen Sie neben Daten das Symbol + aus.
Wählen Sie Verbinden aus, um eine Verbindung mit externen Daten herzustellen.
Select Azure Data Explorer (Kusto) aus.
Wählen Sie Weiter.
Verwenden Sie einen aussagekräftigen Anzeigenamen für den verknüpften Dienst. Der Name wird im Datenobjekt-Explorer angezeigt und von Azure Synapse-Laufzeiten verwendet, um eine Verbindung mit der Datenbank herzustellen.
Wählen Sie den Azure Data Explorer-Cluster aus Ihrem Abonnement aus, oder geben Sie den URI ein.
Geben Sie die Dienstprinzipal-ID und den Dienstprinzipalschlüssel ein. Stellen Sie sicher, dass dieser Dienstprinzipal über Anzeigezugriff auf die Datenbank für Lesevorgänge und über Erfassungszugriff für die Erfassung von Daten verfügt.
Geben Sie den Azure Data Explorer-Datenbanknamen ein.
Wählen Sie Verbindung testen aus, um sicherzustellen, dass Sie über die richtigen Berechtigungen verfügen.
Klicken Sie auf Erstellen.

Hinweis

(Optional) Verbindung testen überprüft nicht den Schreibzugriff. Stellen Sie sicher, dass die Dienstprinzipal-ID über Schreibzugriff auf die Azure Data Explorer-Datenbank verfügt.
Azure Data Explorer-Cluster und -Datenbanken werden auf der Registerkarte Verknüpft unter dem Abschnitt Azure Data Explorer angezeigt.
Bevor Sie über ein Notebook mit dem verknüpften Dienst interagieren können, muss er im Arbeitsbereich veröffentlicht werden. Klicken Sie in der Symbolleiste auf Veröffentlichen, prüfen Sie die ausstehenden Änderungen, und klicken Sie auf OK.

Hinweis

Im aktuellen Release werden die Datenbankobjekte basierend auf Ihren Microsoft Entra-Kontoberechtigungen in den Azure Data Explorer-Datenbanken aufgefüllt. Beim Ausführen der Apache Spark-Notebooks oder -Integrationsaufträge werden die Anmeldeinformationen im Linkdienst (z. B. Dienstprinzipal) verwendet.

Schnelles Interagieren mit durch Code generierte Aktionen

Wenn Sie mit der rechten Maustaste auf eine Datenbank oder Tabelle klicken, wird eine Liste mit Spark-Beispielnotebooks angezeigt. Wählen Sie eine Option aus, um Daten in Azure Data Explorer zu lesen, zu schreiben oder zu streamen.

Hier sehen Sie ein Beispiel für das Lesen von Daten. Fügen Sie das Notebook an Ihren Spark-Pool an, und führen Sie die Zelle aus.

Hinweis

Bei der erstmaligen Ausführung kann es mehr als drei Minuten dauern, bis die Spark-Sitzung initiiert wurde. Nachfolgende Ausführungen sind dann deutlich schneller.

Einschränkungen

Der Azure Data Explorer-Connector wird für verwaltete virtuelle Azure Synapse-Netzwerke derzeit nicht unterstützt.