Azure Data Explorer-Ausgabe von Azure Stream Analytics

Artikel
06/26/2023

Sie können Azure Data Explorer als eine Ausgabe zum Analysieren von großen Mengen unterschiedlicher Daten aus beliebigen Datenquellen verwenden, z. B. Websites, Anwendungen und Internet der Dinge (Internet of Things, IoT)-Geräte und mehr. Azure-Daten-Explorer ist ein schneller und hochgradig skalierbarer Dienst zur Untersuchung von Daten (Protokoll- und Telemetriedaten). Er hilft Ihnen bei der Verarbeitung der zahlreichen Datenströme, die von moderner Software ausgegeben werden, damit Sie Daten sammeln, speichern und analysieren können. Diese Daten werden für die Diagnose, Überwachung, Berichterstellung, Machine Learning und weitere Analysefunktionen verwendet.

Azure Data Explorer unterstützt verschiedene Erfassungsmethoden, u. a. Connectors zu gängigen Diensten wie Azure Event Hubs, programmgesteuerte Erfassung über SDKs wie .NET und Python sowie Direktzugriff auf das Modul für die Durchsuchung. Azure-Daten-Explorer ist für die weiterführende Analyse und Visualisierung von Daten mit Analyse- und Modellierungsdiensten integriert.

Weitere Informationen über Azure Data Explorer finden Sie unter Was ist Azure Data Explorer?.

Weitere Informationen zum Erstellen eines Azure Data Explorer-Clusters mithilfe des Azure-Portals finden Sie unter Schnellstart: Erstellen eines Azure Data Explorer-Clusters und einer Datenbank.

Hinweis

Azure Data Explorer von Azure Stream Analytics unterstützt die Ausgabe an Azure Synapse Data Explorer. Um im Azure Synapse Data Explorer in Ihre Cluster zu schreiben, geben Sie die URL Ihres Clusters im Konfigurationsbereich für die Ausgabe des Azure Data Explorer in Ihrem Azure Stream Analytics-Job an.

Ausgabekonfiguration

Die folgende Tabelle enthält die Eigenschaftennamen und ihre Beschreibungen zum Erstellen einer Azure Data Explorer-Ausgabe.

Eigenschaftenname	BESCHREIBUNG
Ausgabealias	Ein Anzeigename, der in Abfragen verwendet wird, um die Abfrageausgabe an diese Datenbank weiterzuleiten.
Subscription	Das Azure-Abonnement, das Sie für Ihren Cluster verwenden wollen.
Cluster	Ein eindeutiger Name, der Ihren Cluster identifiziert. Der Domänenname <region>.kusto.windows.net wird an den von Ihnen angegebenen Clusternamen angefügt. Der Name darf nur Kleinbuchstaben und Zahlen enthalten. Er muss zwischen 4 und 22 Zeichen enthalten.
Datenbank	Der Name der Datenbank, an die Sie die Ausgabe senden. Der Datenbankname muss innerhalb des Clusters eindeutig sein.
Authentifizierung	Eine verwaltete Identität von Microsoft Entra ID, die Ihrem Cluster ermöglicht, einfach auf andere durch Microsoft Entra geschützte Ressourcen wie Azure Key Vault zuzugreifen. Da die Identität von der Azure-Plattform verwaltet wird, müssen Sie keine Geheimnisse bereitstellen oder rotieren. Die Konfiguration der verwalteten Identität wird zurzeit nur für die Aktivierung von kundenseitig verwalteten Schlüsseln für Ihren Cluster unterstützt.
Tabelle	Der Name der Tabelle, in die die Ausgabe geschrieben wird. Beim Tabellennamen wird die Groß- und Kleinschreibung beachtet. Das Schema dieser Tabelle sollte genau der Anzahl der Felder und deren Typen entsprechen, die Ihre Auftragsausgabe generiert.

Partitionierung

Die Partitionierung muss aktiviert werde und basiert auf der PARTITION BY-Klausel in der Abfrage. Wenn die Option „Partitionierung erben“ aktiviert ist, wird die Eingabepartitionierung für vollständig parallelisierbare Abfragen verwendet.

Wann sollen Azure Data Explorer und Azure Stream Analytics verwendet werden

Zu den Merkmalen von Azure Stream Analytics gehören:

Modul zur Streamverarbeitung: kontinuierlich, Streaminganalyse in Echtzeit
Auftragsbasiert
Lookback-Fenster von 1 Millisekunde bis 7 Tage für temporale In-Memory-Analysen und Streamverarbeitung
Erfassung von Azure Event Hubs und Azure IoT Hub mit Wartezeit unter einer Sekunde

Zu den Merkmalen von Azure Data Explorer gehören:

Analysemodul: nach Bedarf, interaktive Analyse in Echtzeit
Streamingdatenerfassung in einen persistenten Datenspeicher, zusammen mit Abfragefunktionen
Erfassung von Daten aus Event Hubs, IoT Hub, Azure Blob Storage, Azure Data Lake Storage, Kafka, Logstash, Spark und Azure Data Factory
Wartezeit von 10 Sekunden bis 5 Minuten für Workloads mit hohem Durchsatz
Einfache Datentransformation durch eine Aktualisierungsrichtlinie während der Erfassung

Sie können den Umfang von Echtzeitanalysen erheblich erweitern, indem Sie Azure Stream Analytics und Azure Data Explorer zusammen verwenden. Hier sind einige Szenarien:

Stream Analytics erkennt Anomalien in Echtzeit, und Azure Data Explorer hilft durch interaktive Erkundung herauszufinden, wie und warum sie aufgetreten sind.
Stream Analytics deserialisiert eingehende Datenströme für die Verwendung in Azure Data Explorer (z. B. die Erfassung des Protobuf-Formats mithilfe eines benutzerdefinierten Deserialisierers oder benutzerdefinierter Binärformate).
Stream Analytics kann eingehende Datenströme zur Verwendung in Azure Data Explorer aggregieren, filtern, anreichern und transformieren.

Andere Szenarios und Einschränkungen

Der Name der Spalten und des Datentyps müssen zwischen der Azure Stream Analytics-SQL-Abfrage und der Azure Data Explorer-Tabelle übereinstimmen. Beim Vergleich wird die Groß-/Kleinschreibung beachtet.
Spalten, die in Ihren Azure Data Explorer-Clustern vorhanden sind, aber in Azure Stream Analytics fehlen, werden ignoriert. Spalten, die in Azure Stream Analytics fehlen, lösen einen Fehler aus.
Die Reihenfolge Ihrer Spalten in Ihrer Azure Stream Analytics-Abfrage spielt keine Rolle. Das Schema der Azure Data Explorer-Tabelle bestimmt die Reihenfolge.
Azure Data Explorer verfügt über eine Richtlinie für die Aggregation (Batchverarbeitung) für die Datenerfassung, die für die Optimierung des Erfassungsprozesses konzipiert ist. Die Richtlinie ist standardmäßig mit 5 Minuten, 1000 Elementen oder einem Datenvolumen von 1 GB konfiguriert, deshalb kann es zu Wartezeiten kommen. Aktivieren Sie die Streamingerfassung in Ihrem Cluster, um die Latenz zu verringern, und führen Sie dann eine Tabelle oder Datenbank aus, indem Sie die Schritte unter Konfigurieren der Streamingerfassung in Ihrem Azure Data Explorer-Cluster ausführen. Informationen zu Aggregationsoptionen finden Sie IngestionBatching-Richtlinie.

Nächste Schritte

Schnellstart: Erstellen eines Stream Analytics-Auftrags mithilfe des Azure-Portals

Share via