Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Verwenden Sie die CREATE FLOW Anweisung, um Datenflüsse oder Rückfüllungen für Tabellen in einer Pipeline zu erstellen.
Syntax
CREATE FLOW flow_name [COMMENT comment] AS
{
AUTO CDC INTO target_table create_auto_cdc_flow_spec |
INSERT INTO [ONCE] target_table BY NAME query
}
Die Parameter
flow_name
Der Name des zu erstellenden Flusses.
KOMMENTAR
Eine optionale Beschreibung für den Fluss.
-
Eine
AUTO CDC ... INTOAnweisung, die den Ablauf mithilfe einercreate_auto_cdc_flow_specdefiniert. Sie müssen entweder eineAUTO CDC ... INTOAnweisung oder eineINSERT INTOAnweisung einschließen. Verwenden SieAUTO CDC ... INTObei Abfragen, wenn die Quellabfrage die Änderungsdatensemantik nutzt.Weitere Informationen finden Sie unter AUTO CDC INTO (Pipelines).
target_table
Die Tabelle, die aktualisiert werden soll. Dies muss eine Streamingtabelle sein.
INSERT IN
Definiert eine Tabellenabfrage, die in die Zieltabelle eingefügt wird. Wenn die Option nicht angegeben wird, muss es sich bei der
ONCEAbfrage um eine Streamingabfrage handeln. Verwenden Sie das STREAM-Schlüsselwort, um Streamingsemantik zum Lesen aus der Quelle zu verwenden. Wenn beim Lesen eine Änderung oder löschung in einem vorhandenen Datensatz auftritt, wird ein Fehler ausgelöst. Es ist am sichersten, aus statischen oder nur angefügten Quellen zu lesen. Zum Einlesen von Daten mit Änderungs-Commits können Sie Python und dieSkipChangeCommitsOption zur Fehlerbehandlung verwenden.INSERT INTOschließt sich mitAUTO CDC ... INTOgegenseitig aus. Verwenden Sie diese FunktionAUTO CDC ... INTO, wenn die Quelldaten die Funktionalität für die Änderungsdatenerfassung (Change Data Capture, CDC) enthalten. Verwenden SieINSERT INTO, wenn die Quelle nicht verwendet wird.Weitere Informationen zum Streamen von Daten finden Sie unter Transformieren von Daten mit Pipelines.
EINMAL
Definieren Sie optional den Fluss als einmaligen Ablauf, z. B. als Rückfüllvorgang. Die Verwendung von
ONCEändert den Ablauf auf zwei Arten:- Die Quelle
queryodercreate_auto_cdc_flow_specist keine Streamingtabelle. - Der Fluss wird standardmäßig einmal ausgeführt. Wenn die Pipeline mit einer vollständigen Aktualisierung aktualisiert wird, wird der
ONCEFlow erneut ausgeführt, um die Daten neu zu generieren.
- Die Quelle
Examples
-- EXAMPLE 1:
-- Create a streaming table, and add two flows that append data to it:
CREATE OR REFRESH STREAMING TABLE users;
-- first flow into target_table:
CREATE FLOW users_flow AS
INSERT INTO users
SELECT * FROM stream(raw_data.users);
-- second flow into target_table:
CREATE FLOW backfill_users AS
INSERT INTO ONCE users
SELECT * FROM user_backfill_table;
-- EXAMPLE 2:
-- Create a streaming table, and add a flow that applies CDC changes to it:
CREATE OR REFRESH STREAMING TABLE admins_cdc_target_table;
-- first flow into target_table:
CREATE FLOW admin_cdc_flow AS
AUTO CDC INTO admins_cdc_target_table
FROM stream(cdc_data.admins)
KEYS (userId)
APPLY AS DELETE WHEN
operation = "DELETE"
SEQUENCE BY sequenceNum
COLUMNS * EXCEPT (operation, sequenceNum)
STORED AS SCD TYPE 2;