Uruchamianie zadania w celu pozyskiwania danych

Ukończone

Po utworzeniu i zapisaniu zapytania możesz uruchomić zadanie usługi Azure Stream Analytics, aby przetworzyć zdarzenia w danych wejściowych i zapisać wyniki w danych wyjściowych. Po uruchomieniu zapytanie będzie uruchamiane w sposób ciągły do momentu zatrzymania; stale pozyskiwanie nowych danych zdarzeń do obszaru roboczego usługi Azure Synapse Analytics (do tabeli w relacyjnym magazynie danych lub plikach w usłudze Data Lake w zależności od typu danych wyjściowych).

Praca z pozyskanymi danymi

Możesz pracować z pozyskanymi danymi przesyłanymi strumieniowo, takimi jak inne dane w usłudze Azure Synapse Analytics, łącząc je z danymi pozyskanymi przy użyciu technik przetwarzania wsadowego lub synchronizowane z operacyjnych źródeł danych przy użyciu usługi Azure Synapse Link.

Wykonywanie zapytań dotyczących danych w relacyjnym magazynie danych

Jeśli dane wyjściowe usługi Azure Synapse Analytics były używane do pozyskiwania wyników zadania przetwarzania strumienia do tabeli w dedykowanej puli SQL, możesz wykonać zapytanie względem tabeli przy użyciu zapytania SQL, podobnie jak w przypadku każdej innej tabeli. Wyniki zapytania będą zawsze zawierać najnowsze dane do pozyskiwania w momencie uruchomienia zapytania. Magazyn danych może zawierać tabele dla danych przesyłanych strumieniowo, a także tabele dla danych pozyskanych wsadowo, umożliwiając łączenie danych w czasie rzeczywistym i wsadowych na potrzeby analizy historycznej.

Na przykład poniższy kod SQL może służyć do wykonywania zapytań względem tabeli o nazwie factSensorReadings , która zawiera wyniki przetwarzania strumienia, i połączyć ją z tabelą dimDate zawierającą szczegółowe dane dotyczące dat przechwycenia odczytów.

SELECT d.Weekday, s.SensorID, AVG(s.SensorReading) AS AverageReading
FROM factSensorReadings AS s
JOIN dimDate AS d
    ON CAST(s.ReadingTime AS DATE) = d.DateKey
GROUP BY d.Weekday, s.SensorID

Napiwek

Aby dowiedzieć się więcej na temat używania dedykowanej puli SQL do analizowania danych w magazynie danych, zobacz moduł Analizowanie danych w magazynie danych relacyjnych w usłudze Microsoft Learn.

Wykonywanie zapytań dotyczących danych w usłudze Data Lake

Ponieważ dane przesyłane strumieniowo są pozyskiwane do plików w usłudze Data Lake, można wykonywać zapytania dotyczące tych plików przy użyciu bezserwerowej puli SQL w usłudze Azure Synapse Analytics. Na przykład następujące zapytanie odczytuje wszystkie pola ze wszystkich plików Parquet w folderze sensors w kontenerze systemu plików danych .

SELECT *
FROM OPENROWSET(
    BULK 'https://mydatalake.blob.core.windows.net/data/sensors/*',
    FORMAT = 'parquet') AS rows

Napiwek

Aby dowiedzieć się więcej na temat używania bezserwerowych pul SQL do wykonywania zapytań dotyczących plików w usłudze Data Lake, zobacz Używanie bezserwerowej puli SQL usługi Azure Synapse do wykonywania zapytań dotyczących plików w module data lake w usłudze Microsoft Learn.

Możesz również wykonać zapytanie względem magazynu data lake przy użyciu kodu uruchomionego w puli platformy Apache Spark, jak pokazano w tym przykładzie:

%%pyspark
df = spark.read.load('abfss://data@datalake.dfs.core.windows.net/sensors/*', format='parquet'
)
display(df)

Napiwek

Aby dowiedzieć się więcej na temat używania pul platformy Apache Spark do wykonywania zapytań dotyczących plików w usłudze Data Lake, zobacz moduł Analizowanie danych za pomocą platformy Apache Spark w usłudze Azure Synapse Analytics w witrynie Microsoft Learn.