Ergebnisse von Azure Stream Analytics

Ein Azure Stream Analytics-Auftrag besteht aus einer Eingabe, Abfrage und Ausgabe. Sie können transformierte Daten an mehrere Ausgabetypen senden. In diesem Artikel werden die unterstützten Stream Analytics-Ausgaben aufgeführt. Wenn Sie Ihre Stream Analytics-Abfrage entwerfen, verweisen Sie mithilfe der INTO-Klausel auf den Namen der Ausgabe. Sie können eine einzelne Ausgabe pro Auftrag oder mehrere Ausgaben pro Streamingauftrag verwenden, indem Sie der Abfrage mehrere INTO-Klauseln hinzufügen.

Zum Erstellen, Bearbeiten und Testen von Stream Analytics-Auftragsausgaben können Sie das Azure-Portal, Azure PowerShell, .NET-API, REST-API, Visual Studio und Visual Studio Code verwenden.

Hinweis

Verwenden Sie Stream Analytics-Tools für Visual Studio Code, um die beste lokale Entwicklungsumgebung zu erzielen. Stream Analytics-Tools für Visual Studio 2019 (Version 2.6.3000.0) haben bekannte Featurelücken und werden in Zukunft nicht verbessert.

Einige Ausgabetypen unterstützen die Partitionierung , wie in der folgenden Tabelle dargestellt.

Alle Ausgaben unterstützen die Batchverarbeitung, aber nur einige unterstützen das explizite Festlegen der Ausgabebatchgröße. Weitere Informationen finden Sie im Abschnitt mit den Ausgabebatchgrößen .

Ausgabetyp	Partitionierung	Sicherheit
Azure Data Explorer	Ja	Verwaltete Identität
Azure-Funktionen	Ja	Zugriffsschlüssel
Azure Synapse Analytics	Ja	SQL-Benutzerauthentifizierung, verwaltete Identität
Blob-Speicher und Azure Data Lake Gen 2	Ja	Zugriffstaste, verwaltete Identität
Azure Cosmos DB	Ja	Zugriffstaste, verwaltete Identität
Azure Data Lake Storage Gen 2	Ja	Microsoft Entra Benutzer- verwaltete Identität
Azure Event Hubs	Ja, die Partitionsschlüsselspalte muss in der Ausgabekonfiguration festgelegt werden.	Zugriffstaste, verwaltete Identität
Kafka (Vorschau)	Ja, die Partitionsschlüsselspalte muss in der Ausgabekonfiguration festgelegt werden.	Zugriffstaste, verwaltete Identität
Azure-Datenbank für PostgreSQL	Ja	Authentifizierung mit Benutzername und Kennwort
Power BI	Nein	Microsoft Entra-Benutzer, Managed Identity
Azure Service Bus-Warteschlangen	Ja	Zugriffstaste, verwaltete Identität
Themen zu Azure Service Bus	Ja	Zugriffstaste, verwaltete Identität
Azure SQL-Datenbank	Ja, wahlweise.	SQL-Benutzerauthentifizierung, verwaltete Identität
Azure-Tabellenspeicher	Ja	Kontoschlüssel

Von Bedeutung

Azure Stream Analytics verwendet die Insert- oder Replace-API von Haus aus. Dieser Vorgang ersetzt eine vorhandene Entität oder fügt eine neue Entität ein, wenn sie nicht in der Tabelle vorhanden ist.

Partitionierung

Stream Analytics unterstützt Partitionen für alle Ausgaben mit Ausnahme von Power BI. Weitere Informationen zu Partitionsschlüsseln und der Anzahl der Ausgabeautoren finden Sie im Artikel für den spezifischen Ausgabetyp, an dem Sie interessiert sind. Artikel für Ausgabetypen sind im vorherigen Abschnitt verknüpft.

Für eine erweiterte Optimierung der Partitionen können Sie die Anzahl der Ausgabeschreiber mithilfe einer INTO <partition count> (siehe INTO) Klausel in Ihrer Abfrage steuern. Dieses Steuerelement kann Ihnen dabei helfen, eine gewünschte Auftragstopologie zu erreichen. Wenn der Ausgabeadapter nicht partitioniert ist, führt das Fehlen von Daten in einer Eingabepartition zu einer Verzögerung. Diese kann die gesamte Zeitspanne der Eingangsverzögerung umfassen. In solchen Fällen wird die Ausgabe in einen einzigen Writer zusammengeführt, was Engpässe in Ihrer Pipeline verursachen kann. Weitere Informationen zur Richtlinie für verspätete Ankunft finden Sie unter Überlegungen zur Reihenfolge von Ereignissen in Azure Stream Analytics.

Ausgabebatchgröße

Alle Ausgaben unterstützen die Batchverarbeitung, aber nur einige unterstützen das explizite Festlegen der Batchgröße. Azure Stream Analytics verwendet Batches mit variabler Größe, um Ereignisse zu verarbeiten und in Ausgaben zu schreiben. In der Regel schreibt das Stream Analytics-Modul nicht jeweils eine Nachricht und verwendet Batches zur Effizienz. Wenn die Rate der eingehenden und ausgehenden Ereignisse hoch ist, verwendet Stream Analytics größere Batches. Wenn die Ausgangsrate niedrig ist, werden kleinere Batches verwendet, um die Latenz gering zu halten.

Aufteilungsverhalten für Avro- und Parquet-Dateien

Eine Stream Analytics-Abfrage kann mehrere Schemas für eine bestimmte Ausgabe generieren. Die Liste der projizierten Spalten und der dazugehörige Typ kann sich auf Basis jeder einzelnen Zeile ändern. Standardmäßig unterstützen die Avro- und Parkettformate keine Variablenschemas in einer einzelnen Datei.

Die folgenden Verhaltensweisen können auftreten, wenn Sie einen Datenstrom mit Variablenschemas mithilfe der folgenden Formate an eine Ausgabe weiterleiten:

Wenn die Schemaänderung erkannt werden kann, wird die aktuelle Ausgabedatei geschlossen, und eine neue Datei im neuen Schema initialisiert. Das Aufteilen von Dateien als solche verlangsamt die Ausgabe stark, wenn Schemaänderungen häufig auftreten. Dieses Verhalten kann sich stark auf die Gesamtleistung des Auftrags auswirken.
Wenn die Schemaänderung nicht erkannt werden kann, wird die Zeile höchstwahrscheinlich abgelehnt, und der Auftrag bleibt hängen, da die Zeile nicht ausgegeben werden kann. Geschachtelte Spalten oder Arrays mit mehreren Typen werden nicht erkannt und abgelehnt.

Betrachten Sie Ausgaben im Avro- oder Parquet-Format als stark typisiert (Schema-on-Write) und schreiben Sie entsprechende Abfragen, indem Sie explizite Konvertierungen und Projektionen für ein einheitliches Schema verwenden.

Wenn Sie mehrere Schemas generieren müssen, sollten Sie mehrere Ausgaben erstellen und Datensätze mithilfe einer WHERE Klausel in jedes Ziel aufteilen.

Eigenschaften des Batchverarbeitungsfensters für die Parquet-Ausgabe

Wenn Sie die Azure Resource Manager-Vorlagenbereitstellung oder die REST-API verwenden, legen Sie zwei Eigenschaften für Batchfenster fest:

timeWindow

Die maximale Wartezeit pro Batch. Setzen Sie den Wert auf eine Zeichenfolge von Timespan. Verwenden Sie 00:02:00 z. B. zwei Minuten. Nach diesem Zeitpunkt wird der Batch in die Ausgabe geschrieben, auch wenn die Mindestzeilenanforderung nicht erfüllt ist. Der Standardwert ist eine Minute, und der zulässige Maximalwert beträgt zwei Stunden. Wenn Ihre Blobausgabe eine Pfadmusterhäufigkeit aufweist, kann die Wartezeit nicht über dem Partitionszeitbereich liegen.
sizeWindow

Die Anzahl der Mindestzeilen pro Batch. Für Parquet erstellt jeder Batch eine neue Datei. Der aktuelle Standardwert ist 2.000 Zeilen und der zulässige Höchstwert beträgt 10.000 Zeilen.

Api Version 2017-04-01-Preview oder höher unterstützt diese Eigenschaften des Batchfensters. Hier ist ein Beispiel für die JSON-Nutzlast für einen REST-API-Aufruf:

"type": "stream",
      "serialization": {
        "type": "Parquet",
        "properties": {}
      },
      "timeWindow": "00:02:00",
      "sizeWindow": "2000",
      "datasource": {
        "type": "Microsoft.Storage/Blob",
        "properties": {
          "storageAccounts" : [
          {
            "accountName": "{accountName}",
            "accountKey": "{accountKey}",
          }
          ],

Nächste Schritte

Schnellstart: Erstellen eines Stream Analytics-Auftrags mithilfe des Azure-Portals

Feedback

War diese Seite hilfreich?

Last updated on 2026-02-25