Python を使用してパイプラインでビューを定義するには、 @temporary_view デコレーターを適用し、マテリアライズド ビューやストリーミング テーブルなど、他のクエリでビューを名前で参照します。 ビューの結果は、クエリ時に計算されます。
注
以前の dlt モジュールでは、@view デコレーターを使用して一時的なビューを定義しました。 Databricks では、 pyspark.pipelines モジュール ( dpとしてインポート) と @temporary_view デコレーターを使用して一時ビューを定義することをお勧めします。
構文
from pyspark import pipelines as dp
@dp.temporary_view(
name="<name>",
comment="<comment>")
@dp.expect(...)
def <function-name>():
return (<query>)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
| 機能 | function |
必須。 ユーザー定義クエリから Apache Spark DataFrame またはストリーミング DataFrame を返す関数。 |
name |
str |
ビュー名。 指定しない場合は、既定で関数名が使用されます。 名前は、パイプラインの対象となるカタログとスキーマ内で一意である必要があります。 |
comment |
str |
テーブルの説明です。 |