Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka obsahuje Pythonovou referenční dokumentaci týkající se očekávání pipeline.
Dekorátory pro očekávání deklarují omezení kvality dat u materializovaných zobrazení, streamovaných tabulek nebo dočasných zobrazení vytvořených v rámci kanálu.
Tento dp modul obsahuje šest dekorátorů pro řízení chování očekávání. Následující tabulka popisuje dimenze, na kterých se tyto permutace liší:
| Chování | Možnosti |
|---|---|
| Akce při porušení |
|
| Počet očekávání | Jedno očekávání nebo více očekávání. |
Do datových sad můžete přidat několik dekorátorů očekávání a zajistit tak flexibilitu v striktnosti pro omezení kvality dat.
Při použití expect_all dekorátorů, má každé očekávání vlastní popis a reportuje podrobné metriky.
Syntaxe
Očekávané dekorátory přicházejí za @dp.table(), @dp.materialized_view nebo @dp.temporary_view() dekorátor a před funkcí pro definici datové sady, jak je znázorněno v následujícím příkladu:
from pyspark import pipelines as dp
@dp.table()
@dp.expect(description, constraint)
@dp.expect_or_drop(description, constraint)
@dp.expect_or_fail(description, constraint)
@dp.expect_all({description: constraint, ...})
@dp.expect_all_or_drop({description: constraint, ...})
@dp.expect_all_or_fail({description: constraint, ...})
def <function-name>():
return (<query>)
Parametry
| Parameter | Typ | Description |
|---|---|---|
description |
str |
Povinné. Popis, který identifikuje omezení. Popisy omezení musí být pro každou datovou sadu jedinečné. |
constraint |
str |
Povinné. Klauzule constraint je podmíněný příkaz SQL, který se musí vyhodnotit na true nebo false pro každý záznam. Omezení obsahuje skutečnou logiku toho, co se ověřuje. Pokud záznam selže s touto podmínkou, aktivuje se očekávání. |
Dekorátory expect_all vyžadují, aby popisy a omezení byly předány jako dict páry klíč-hodnota.