Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Menentukan skema input. Beberapa sumber data (misalnya, JSON) dapat menyimpulkan skema input secara otomatis dari data. Menentukan skema di sini memungkinkan sumber data untuk melewati inferensi skema dan mempercepat pemuatan data.
Sintaksis
schema(schema)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
schema |
StructType atau str | Objek StructType atau string berformat DDL (misalnya, col0 INT, col1 DOUBLE). |
Pengembalian Barang
DataStreamReader
Examples
from pyspark.sql.types import StructField, StructType, StringType
spark.readStream.schema(StructType([StructField("data", StringType(), True)]))
# <...streaming.readwriter.DataStreamReader object ...>
spark.readStream.schema("col0 INT, col1 DOUBLE")
# <...streaming.readwriter.DataStreamReader object ...>
Tentukan skema yang berbeda untuk file CSV:
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.readStream.schema("col0 INT, col1 STRING").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: string (nullable = true)