데이터 원본의 데이터 세트를 기반으로 테이블을 만듭니다.
문법
createTable(tableName: str, path: str = None, source: str = None, schema: StructType = None, description: str = None, **options: str)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
tableName |
str | 만들 테이블의 이름입니다. 카탈로그 이름으로 정규화할 수 있습니다. |
path |
str, 선택 사항 | 이 테이블의 데이터가 있는 경로입니다.
path 지정되면 지정된 경로의 데이터에서 외부 테이블이 만들어집니다. 그렇지 않으면 관리되는 테이블이 만들어집니다. |
source |
str, 선택 사항 | 이 테이블의 원본(예: 'parquet'등) 'orc'입니다. 지정하지 않으면 source 구성된 spark.sql.sources.default 기본 데이터 원본이 사용됩니다. |
schema |
StructType선택적 |
이 테이블의 스키마입니다. |
description |
str, 선택 사항 | 이 테이블에 대한 설명입니다. |
**options |
dict, 선택 사항 | 테이블에 지정할 추가 옵션입니다. |
Returns
DataFrame
테이블과 연결된 DataFrame입니다.
예제
# Creating a managed table.
_ = spark.catalog.createTable("tbl1", schema=spark.range(1).schema, source='parquet')
_ = spark.sql("DROP TABLE tbl1")
# Creating an external table.
import tempfile
with tempfile.TemporaryDirectory(prefix="createTable") as d:
_ = spark.catalog.createTable(
"tbl2", schema=spark.range(1).schema, path=d, source='parquet')
_ = spark.sql("DROP TABLE tbl2")