Python을 사용하여 파이프라인에서 보기를 정의하려면 데코레이터를 @temporary_view 적용한 다음 구체화된 뷰 및 스트리밍 테이블을 비롯한 다른 쿼리에서 이름으로 보기를 참조합니다. 뷰의 결과는 쿼리할 때 계산됩니다.
비고
이전 dlt 모듈에서는 @view 데코레이터를 사용하여 임시 보기를 정의했습니다. Databricks는 pyspark.pipelines 모듈을 dp로 가져오고 @temporary_view 데코레이터를 사용하여 임시 뷰를 설정하는 것이 좋습니다.
Syntax
from pyspark import pipelines as dp
@dp.temporary_view(
name="<name>",
comment="<comment>")
@dp.expect(...)
def <function-name>():
return (<query>)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
| 기능 | function |
필수 사항입니다. 사용자 정의 쿼리에서 Apache Spark DataFrame 또는 스트리밍 DataFrame을 반환하는 함수입니다. |
name |
str |
뷰 이름입니다. 제공되지 않으면 기본적으로 함수 이름이 지정됩니다. 이름은 파이프라인의 대상이 되는 카탈로그 및 스키마 내에서 고유해야 합니다. |
comment |
str |
테이블에 대한 설명입니다. |